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CAP.I. NOŢIUNI GENERALE. 


41. Cercetarea geografică si metodele statistice. 
1. 11 Ce este Statistica? 


o. definiţie riguroasă a acestei discipline + este greu de dat — în 
literatura de specialitate au fost inventariate peste o sută de încercări î în acest 
sens; mai mult, în aceeaşi literatură termenul „statistică” este folosit în. cel 
puţin două sensuri diferite!, “ca sá nu mai vorbim de conotatiile termenului : 
- în limbajul comun... | 
| Din a de Velara al Geografiei, ca ştiinţă a naturii, o pese “ali 
E acceptabilă ar fi următoarea: | i 


„ Statistica este rav care se ocupă cu descrierea şi analiza 
„numerică a- fenomenelor <de: masă, dezvăluind 
i particularitáyile lor de mărime, structură, intial „precum. 
“şi conexiunile lor interne. . În felul acesta Statistica își 
„propune să contribuie la evidenţierea legilor ce guvernează 2 
-manifestările spațiattemporale ale ia acestor r fenomene... 


Dar ce înseamnă init de masă? | 

Ín limba greacá »phainomenon” inseamná „ceea ce apare”. Altfel 
spus, numim ,fenomene” -acele caracteristici exterioare, vizibile sau, oricum, 
observabile ale realităţii materiale înconjurătoare. | 


Ceea ce diferenţiază fenomenele de masă de alte tipuri. de fenomene 


este faptul că ele se constituie ca rezultat al acţiunii colective şi repetate a 
„ „unui mare număr de factori întâmplători. De aceea pentru a accede la esenţă, 
adică pentru. a vedea ce se ascunde. în spatele fenomenului, este nevoie să 


de zat H 
a) ştiinţa cu acest nume; b) criteriu formal pentru TAA ipotezelor statistice (vezi 
l $ 4 3). 


[k analiza un mare număr de c cazuri individualo. 


Cateva cd de frondi de masă: AN 

i „e comportamentul demografic. al unei popula, ca rezultat al 
interacțiunii complexe dintre factorii- economici, sociali, culturali, 
- educafionali, psihologici. Ca fenomen de masă, el poate fi pus în evidenţă 
- doar prin intermediul unor indici. demografici (natalitate, mortalitate, spor 
natural, fertilitate feminină, structura populaţiei pe sexe, grupe de vârstă sau 
profesională, apoi gradul de instruire a. populaţiei, nivelul. de. trai etc.) 
obținuți din- inventarierea. unui mare număr de indivizi ai ps 
1 respective; ES 

¿O tendinţa de peneira a , climei globului terestru - == idhini un 
fenomen complex, ce poate fi decelat doar prin analiza şi prelucrarea unor | 
„cantităţi uriaşe de date climatologice prevent ( de. la mii de ga de 
observaţie ce iras alea întregului glob. 


| “La scări spaţiale mai mari sau mai mici se pob identifica nenumărate . 
exemple de astfel. de fenomene, pentru. care se mai utilizează denumiri 
alternative ca „fenomene colective”, „fenomene statistice” sau „fenomene 3 
atipice”. Acest ultim termen exprimă destul de sugestiv esenţa unui fenomen 

“de masă: aceea de a nu se putea reproduce î în mod identic aproape niciodată 
si (ieg dacă s se Tae în mod K d se datorează e. aia apă 


Statistica, privită c ca domeniu distinct al -unoasterii umane, a apărut 
iniţial ca o generalizare sui generis a unor date despre fenomenele social- 
E, economice. Pe la mijlocul secolului trecut ea era, încă, privită ca o ştiinţă 
4 socială. Treptat, însă, Statistica s-a „infiltrat” în domenii âparţinând ştiinţelor 

naturii, încât s-au conturat, cu: timpul, noi discipline ştiinţifice — de ex. 


„statistica matematică, fizica şi mecanica statistică, statistica biologică ş.a. 


~ Statutul actual al Statisticii ca ştiinţă este încă neclar, de unde ŞI: | 
i marea diversitate a definiţiilor î în circulaţie despre care aminteam anterior. În 


literatura - dedicată. acestui subiect se pot distinge, totuşi, două curente 


„principale de opinie: unii califică statistica drept o ştiinţă, iar alţii o consideră 
(ŞI) o metodă. Este cert, însă, că începând din perioada interbelică, sub 
impulsul unor personalităţi de seamă din domeniu ca K.Pearson (1857- -1936) 

“ŞI B.A. Fisher ( 1890-1962), statistica şi-a elaborat fundamente ştiinţifice (mai . 
| ales > Ea foarte precise. . Ea se dezvoltă î în prezent ca stiință cvasi- | 


” 


` - independentă, die având însuşirea, mai mult decât altele, de afii în n acelaşi. : 
timp o ştiinţă, dar şi o metodă cu aplicabilitate î în alte domenii ştiinţifice... | 


“Indiferent dacă este concepută ca ştiinţă sau ca. metodă, aiiai h 


acma prezintă două laturi diferite, dar complementare: 


-1%.. descrierea statistică — fixarea informaţiei PA a din l 


A peralta datelor de observafie (alapi sub forme diverse, das. cel : mai ; 
E adesea sub formă de indici sau parametri statistici; if) | 


A | inferenta! statisticá — tratarea teoreticá a datelor de observaţie pi 


15 parin a trage. concluziile logice, 'concluzii care cin e de ba En 


domeniului din care provin respectivele date. TNN 
Prima latură, mai accesibilă feledi comune, este cintat io n 
denumirea de statistică descriptivă. Cea de-a doua, mai dificilă, întrucât mai 


- formalizată din punctul de vedere al fundamentelor matematice, constituie 


aşa-numita statistică inferentialá sau inductivá, numită uneori şi statistică 


- —probabilistá datorită a că că baza el matematică o constituie teoria y 


probabilităților.. | 
Trebuie subliniat că în cadrul demersului statistic sale, diia aspecte | 


lana e privite ca etape ale unuia şi. aceluiaşi PRE de tin umană. 


1,1. 2. Statistica í în Geografie 


e 


sy Oi incursiune în inrciuda oderaficin ce piane e iati AREER 3 | 


epistemologice specifice ar putea conduce la concluzia că Geografia nu 


beneficiază, până în prezent, „de o riguroasă circumscriere a sferei sale de 


‘cercetare. Tah diversele opinii asupra obiectului de. studiu converg cel puţin. 
într-un punct: în sarcina: Geografiei intră analiza repartitiei şi localizării 

| spaţiale a obiectelor, fenomenelor şi proceselor naturale sau sociale. Deoarece 
repartiţia şi localizarea spaţială creează organizări teritoriale cu trăsături 


diferite de la un loc la altul, se evidenţiază existenţa unor diferențieri spațiale 


“ale sistemelor naturale, sociale sau ale geosociosistemelor. Aceste diferențieri 
sunt, fără doar şi poate, expresia unor fenomene de masă. Prin urmare rolul 


Gongmiieis este acela de a dezvălui esenţa: acestor. fenomene d de masă, deci a Ki 


jara (at. inferre a ducă) éste sita vita de: derivare a unui enunţ ¡ din 'altůl; prin 


ud care se admite o judecată (al cărei adevăr nu este verificat direct) în virtutea unei legături. aci 
cu alte judecăți considerate ca. adevărate pi F. Marcu 7 c -Maneca, digul de —+. i 
: Ed. ae Amo, is) 4 ; 


crructurii lor spaţiale. tnt cititi nu distribuțiile HE interesează 
geografi, ci mai degrabă faptul că ele variază în configuraţie si intensitate de 
la un loc la altul” (M.Chapot, 1977, p.11). A | 

- Analiza peograiică a fenomenelor şi proceselor. ce caracterizează 
dinamica spatio-temporalá a învelişurilor terestre, ca si analiza relaţiilor 
dintre om (societate) şi suportul spaţial al activităţii sale, este Pepene 
condiţionată de apelul la date cantitative obţinute prin măsurători. 


Câteva exemple: | | | 
+ caracteristicile poziţionale si morfometrice ale unor Milite de la. 
suprafața Terrei pretind informații numerice de np coordonate geografice, 
distanțe, suprafețe, altitudini etc.; | 
„e studiul interacțiunilor dintre inveligurile ariile terestre face bet > 
la date cantitative asupra unor elemente ca temperatura aerului şi solului, 
precipitaţii, debite, presiune atmosferică, viteza vântului, eroziune ete.; 
os localizarea activităţilor umane şi a resurselor aferente necesită 
informaţii precise asupra suprafeţelor de teren cu diferite utilizări/tipuri de 
sol, asupra populaţiei active, resurselor subsolice, i iri de concentrare” 
a activităţilor industriale ş.a.; EN: | | 
=- @ repartiția şi dinamica populaţiei umane nu fot fi urmărite decât 
prin intermediul unor indici cantitativi cum ar fi numărul total sau pe diverse 
categorii, natalitatea, mortalitatea, structura (pe sexe, pe grupe de vârstă, 
oii indici de mobilitate teritorială etc.; 
+ studiul reţelelor de schimburi comerciale şi at Aide dintre 
soparle rețelelor, fluxuri ce constituie manifestări ale interacțiunilor 
eul pretind date cantitative referitoare la reţelele feroviare, rutiere, | 


rin interacțiuni spaţiale” se în eleg e acțiunea reci rocă a p sau mai multe sisteme 
ip P 


cu localizări spaţiale diferita. În domeniul geografiei studiul i.s., abordate la scară macro-spatialá 
| G n aceasta constând deosebirea dintre geografie şi alte ştiinţe care studiază astfel de interacțiuni 
— de ex. sociologia, psihologia, economia, fizica), a condus la elaborarea unor mouele de 
interacțiune spajială dintre care cel mai important este modelul gravitațional. Acest model se 
bazează pe analogia dintre interacţiunea OS şi interacţiunea fizică din teoria A 
a lui Newton: 


fluviale, de transport maritim etc. y date pa volumului schimburilor | 


comerciale $- a. 


îctelamaăiafia cantitative (obsarvati si dls asupra PTA VE 

prat si fenomenelor constituie, aşadar, punctul de plecare pentru 
„demersul cognitiv geografic. În acelaşi timp, ele oferă posibilitatea unui 
demers geografic ştiinţific (în sensul exactităţii). deoarece permit, pe de o 
parte, emiterea unor ipoteze asupra: realității, iar pe de altă parte permit 
verifi carea acestor ipoteze pe eri metodelor. statistico-matematice de 
“analiză a datelor. | 
! Datele geografice provenite « din măsurători şi observații s se referă, în 
mod obişnuit, la | 
EN caracteristici ale. "unor 
- fenomene şi/sau procese | 
care se desfăşoară într-un | 
anumit loc de pe glob şi | 
într-un | anumit moment 
(interval) de timp. De aici | ` 
ideea de a generaliza natura . | - 

datelor geografice sub forma ` 
unei matrici tridimensionale | 
numită „cubul AE PAIR AA E AA E E 
ES (Johnston, 1978; Piayra 1.1. Cubul datelor PEA pă j 

v.fig.1.1). Cele trei 17 A leu A, SIA ES 
dimensiuni ale acestui cub! 
“sunt localizárile (locurile)', timpul şi {denohet roseto a sect TA 


din fig. 1.1 fiecare rând reprezintă un loo, i iar fiecare coloană corespunde uaui--- 


în care: pi interacţiunea dintre locurile i ŞI j; Mp m — aii EA i i şi j (de ex. 
numărul de locuitori); d; Part dintre locurile i si ji kn— - constante ici ai dl 


în Ga geografică românească létmendl, IOMA poate avea mai ui sensuri: 


a) poziţie (aşezare) geografică; b) acţiunea de a repera (identifica) obiecte, fenomene, procese; 
c) acţiunea de a implanta în teritoriu, într-un anumit loc, un obiect, o activitate economică etc. e 


d) acţiunea de a aduce la scară locală, de a descentraliza. 


| 
ir" ANT 
DEJOS! - 


553 reapare nea E tibiei id NE 


i 
1d y yt d 
INE era A a 


"De regulă sensul reiese din context; atunci când a acesta din urmă este SANTEN este 


preferabil să se folosească sinonimele corespunzătoare. — - spre exemplu, î în fig.1. l. s-a folosit 
termenul „locuri” pae a desemna poniji: în ponam a fenomenelor. dass | 


- fenomen (proces); momentelor (intervalelor) ds pi în care se manifestă 
fenomenele cu localizări diferite le corespund „strate” succesive ale cubului. 

Este clar că un asemenea cub poate cuprinde cantități foarte mari 
(teoretic: nelimitate) de date. Tocmai asemenea ansambluri mari de date 
cantitative constituie, îndeobşte, materialul de lucru pentru analizele statistice. 
„Aceasta nu înseamnă, însă, că Statistica nu poate să analizeze şi ansambluri 


mici, sau seturi de date non-numerice, calitative. În toate cazurile, în termeni 


--ntitativi, ea descrie sintetic, clasifică, ierarhizează, evidenţiază structuri şi 
-1zomorfisme' , încearcă să precizeze (cuantifice) tăria şi intensitatea 
legăturilor dintre fenomene, permite generalizări şi interpretări ale acestora. 

- Utilizarea metodelor statistice conferă demersului geografic un spor 
de rigurozitate ştiinţifică, înțeleasă ca precizie a rezultatelor cercetării, 
obiectivitate a concluziilor. precum şi ca diminuare a  redundanței ŞI 
ambiguitágilor discursu.ui geografic. | 


i ay ŞI în cazul altor ştiinţe naturale sau sociale, demersul | stiinjific 
| geografic are două laturi complementare: = ` 


1°. există, pe de o parte, demersul inducti», care încearcă să 


generalizeze o serie de observaţii empirice, înce ercând să ajungă la formularea 
de A Butea şi, apoi, la eiaborarea de modele ale realităţii. | 


i “Exemplu. Se măsoară temperatura ON la diferite altitudini de-a 
“lungul unui versant muntos. Să presupunem că s-au găsit 10°C la 1000 m, 
4°C la 2000 m şi -2°C ia 3000 m altitudine. Repetarea măsurătorilor pe un 


alt versant a dat rezultate asemănătoare. Se trage concluzia că temperatura 


scade. în medie, cu 0,6*C la fiecare 100 m creştere a altitudinii; altfel spus, 
SĂ in stabileşte o legitate pe calea demersului inductiv (trecerea de la particular 
e gengan | 
i 2°. pe de altă e, există demersul deductiv, care se desfăşoară î în 
| sens invers faţă de cel inductiv: se pornește de la O regulá generalá pentru a 
S se rage Piste, concluzii î în legătură. cu un fapt particular. În a acest caz regula 


o 


SS izomorlism (tec: isos - - egal s si airada formă) — identitate de structură între două sau 


"mai multe sisteme cu conţinut diferit; modalitate riguroasă a analogiei, întemeind -analogia ' 


structurală”, diferită de „analogia funcţională” sau „analogia substanţială” ef. Dic: nar de 
“filozofie, EA. Academiei, 1979). . 


10 


t 


R este o piid buh TE unei ten ci care, confruntat c cu i datele de observa, Și 
poater să fie confirmată s sau e cae i AEREA A e 


| Exemplu. i Se dalbă de A fi scăderi, de ia Ecustor s spre ge: a Me 
“a cantității de căldură recepfionatá de suprafaţa terestră, Se emite ipoteza. că 


temperatura medie a aerului. scade în același sens, ştiut fiind faptul că ea este de 


„dependentă de cantitatea de căldură menţionată. Confruntarea ipotezei. cu 


. - datele climatologice dovedeste că ipoteza testată este valabilă doar sub forma 


unei tendinţe generale, pe fondul căreia apar excepţii datorate unor factori AA 
“diverşi (altitudinea şi orientarea culmilor muntoase, albedo-ul suprafejei și 
terestre, curenţii marini et.). eri dica BER Se si da 


a ötesi cledatóni ştiinţifice Gia într-o > permanentă ră F 
a calor două tipuri de demersuri: inducția furnizează reguli şi legităţi care. 
„stau la baza unor. deductii (ipoteze) ce se cer, apoi, confruntate cu datele de. 
| observaţii; eventualele diferenţe intre modelul teoretic şi realitatea faptică pot j 
conduce, pe cale inductivă, la reformulări ` ale legitátilor, ce se cer şi ele 


„verificate ş.a.m.d. Acest cichu generator al progresului cunoaşterii ştiinţifice E: 


“a fost numit, sugestiv, „spirala inductiv-ipotetic-deduciivă” (D) Orice 


y ştiinţă, inclusiv Geografia, cunoaşte. o dezvoltare condiționată de înscrierea pi 


în modelul IID: lar pentru Geografie, Ca ştiinţă al cărei obiect de studiu este | 

încă insuficient precizat şi nesatisfăcător” încadrată în aL s i airin pe 
> recursul = metodele statistice este inevitabil.. sá | i 
Tata de ce, pená un Zr Mol statistică constituie un sprijin i 

lol, Cunoaşterea acestor metode de către geograf are aceeaşi importanţă ji 
ca si stápánirea limbilor stráins de cXtre un diplomat. Nici statistica, pentru. 

geograf, nici limbile străine, pentru diplomat, au constituie obiectul lor de | 
“studiu, însă reprezintă instrumente li irma pentru succesul activităţilor ini 

| „specifice, 

A: cum un pisia ighoranţ poate nu apel 3 un psi, tot - 
astfel un geograf poate face apel la un statistician cu experienţă în analiza 


_ datelor de Observaţii. Dar şi într-un caz şi în altul prezenţă unui intermediar. 


„riscă să reducă eficienţa acţiunilor, ca să nu mai vorbim de posibilitatea 
„ apariţiei, erorilor: de traducere, în cazul interpretului care nu stăpâneşte 
Ci iat str nice rel nt sri ti gr iei d += ber arcas] yen cazul 


A 


statisticianului care nu cunoaşte în profunzime problemele geografice. 


1.2, Vocabularul de bază al Statisticii | 

| “În sens cronologic, primul domeniu de aplicare a Statistici a fost 
demografía. De aceea, deşi în prezent Statistica a pătruns în numeroase alte - 

domenii, o parte din vocabularul său de bază include termeni. originari din d 


k demografie. 


m S-a menţionat ER că i dep-sul analitic în Godi are A bază cubul 
| «datelor geozrafice. Acesta constitute, în fond, un masiv de date al cărui 
- volum poate deveni imorestonani atunci când cercetarea se extinde pe spaţii 


mari sau pe intervale mari de iimp. Un asemenea masiv / de date poștă, în CHR 


> Statisticá, denumirea de populaţie. 

-0 populație este un amsamblu finit sau in; înit de dlemente 

(unităţi, indivizi) distincte care. intrá sub. „incidenţa. 

ah servafiilor şi măsurătorilor. 
„Acesta este ansamblul de referinţă asupra cáruie se exercită iale statistică. 
- El trebuie să fie omogen $ şi precis definit: Elementele care îl formează au în 
comun una sau mai multe proprietăţi, astfel încât să se poată preciza clar 
dacă un element oarecare face parte sau nu din ansamblul luat în considerare, E 
Am funcție de O i proprietății Pop aepo | 


Exemple. RE, Pri, TE 

` l e populaţia (locuitorii) județului Taşi la 1. oi. „1992, = 

A ansamblu finit, elementele au o proprietate comună (domiciliul stabil. tn în 

„ judeţul laşi), spaţiul este precis delimitat de către cd administrative ale 

A judeţului, momentul de timp este precizat; 

ió o populafia lacurilor din Câmpia Moldovei la sfârşitul anului 
199 — ansamblu finit, există o proprietate comună a elementelor (faptul că  - 

d, sunt ape stătătoare permanente), spaţiul delimitat, timpul deasemenea; 

| e populaţia oraşelor cu peste 1 milion ge locuitori din | 
Europa, la sfârşitul anului 1992; 

| e populaţia cantităților junare de precipitaţii la staţia ari 

tal ansamblu practic infinit, din care şirul de EN existent (după 1833) 


p 


y reprezintă doar o mică parte, 


ri majoritatea cazurilor, fi geografie pilas se ansambluri de 


elemente spațiale precis localizabile şi susceptibile de a fi aieiaa iSe. . 
pot distinge trei tipuri mari de unităţi spațiale: | le 
| _* unităţi de tip areal (planiforme) — de exemplu jude regiuni, 
„state, bazine hidrografice, zone climatice ş.a.; | 
| “unităţi de tip punctual (punctiforme) — aşezări umane, puncte 
geodezice, vulcani, stații meteò, confluenţe de râuri ş.a. De remarcat că 
unităţile spaţiale de tip areal pot trece în unităţi de tip. punctual şi invers, 
odată cu trecerea de la o scară spațială de analiză la alta; | 0 
* “unităţi de tip liniar (axiale) — străzi, tronsoane de cale ferată, A, 
râuri, linii de falie, linii de rai a Tronco atmosferice cu a i 
terestră ş.a. 


E. prvin (vezi şi definiția de mai sus). | 

Un individ, sau unitate statistică, este un element >> AA 
aparţine unei “populaţii; apartenența sa la. populația 
„respectivă este indubitabilă,. întrucât este defintta ar z 
| criterii/proprietăţi neambigui:~ 


a Eşantion | | 
| Un eşantion este un sfat ali unei "populi. alcătuit 
„prin extragerea de elemente din populația de bază. F 
„Extragerea se face. după reguli precis stabilite, în funcţie de scdgrul | 
analizei statistice şi de natura datelor de observații. Concluziile analizei pot 
fi apoi. extinse asupra întregii populaţii, bineînţeles, cu o anumită marjă de ` 
eroare, Dar, L. ru foarte important, marja de eroare poate fi calculată; mai 
mult, în unele cazuri această marjă de eroare > poate fi stabilită încă înainte de 
prelevarea esantionului. j 
A Fundamentele matematice ale eco eşantioanelor sunt oferite: de 7 
cátre O ramură a Statisticii numită „Teoria esantionajului”. 
+i Pentru majoritatea disciplinelor geogr» fice metodologiile de cercetare 
z specifice implică lucrul cu eşantioane — de exemplu studiul granulometric al 
„ solului sau aluviunilor, studiul proprietăţilor fizico-chimice ale aerului, apei 
sau rocilor se bazează, inevitabil, pe eşantioane. Pe de altă parte, studiul 
= variațiilor, spaţiale, sau temporale ale elementelor climatice sau e 


g 


porneşte de la pia de date de observaţii care, oricât de lungă a ar fi 


perioada pe care O acoperă, constituie de fapt nişte eşantioane ce pr ovin dintr- ' 


0 Pa practic isteria, sau măcar inaccesibilă (timpul apoi). 


$ . ou aetecistieit statistică | 


| Caracteristica (statistică a) unei e MĂ este o insusire, 
un caracter care este comun tuturor elementelor respectivei 


populații. 
$ Exemple: 


| anumită regiune; | 


. debitul mediu anual (sau A lunar) - — in cazul | 


e vârsta, sexul — în cota populaţiei umane; 
e numărul de locuitori — în cazul populaţiei oraşelor dintr-o 


cb populaţiei râurilor dintr-o zonă oarecare. 
. valoaréa producţiei industriale — în: cazul populatiei Y 


Tabel D D p Populația 


A locuitori. | 
Caract. X 

(numărul de 
doctor. 


Populaţia ] P 


„(oraşele din | 
he Románia, 1992) _ | 


Î1.Alba-lulia 
o [Arnad 


-1260.Zimnicea 
„două condiţii: 
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or oraşelor 
României repartizată ata tigla de | 
de ` unei populaţii înseamnă a stabili o 
„ corespondenţă astfel încât fiecărui 
individ al populaţiei să 1 se asocieze 
una şi numai una dintre valorile pe 
care le poate căpăta caracteristica 
„respectivă. În funcţie de scopurile 
analizei, indivizii pot fi descrişi . 
de (caracterizați) prin intermediul unei 
“| caracteristici sau al mai multora | 
"| (vezi tabelele 1.1 şi 1.2). 
x | valori - (nu 
f neapărat numerice) pe care le poate 
| căpăta un individ în raport cu o 
i “anumită. 
denumirea de modalităţi ale 
3 caracteristicii | 
Modalitágile . 


j ier din România etc. | 
de vedere | 


Din punct 
statistic, a defini o: caracteristică a 


Diferitele 


"caracteristică poartă 


unei. 


respective. A 
- caracteristici - 
„trebuie să veac simultan 


— r. 


„preferinţe muzicale” cu. | 


| as sk fie incompatibile, altfel spus a os ta dintre indivizi şi l 
modalităţile caracteristici, trebuie să fie univocă (unui individ îi core spunde 
-o modalitate şi numai una, chiar dacă una şi aceeaşi modalitate poate 

„corespunde la mai mulţi | indivizi — vezi tab.1.2, 1.3) 
4 2%. sá fie exhaustive, adică să nu existe: indivizi. cărora. nu le 
corespunde nici o modalitate a caracteristici, LON 4 
Tabel el 1.2, “Populaţia județului laşi ia HL 
Exemplu. Säconsideräm m ianuarie 1992, ot, su vârstă îşi 
populaţia - studenţilor de la sax, | 
Facultatea de Geografie din Iaşi, [TT TT 
“la începutul. - “anului - 1995, | Populus Prisa 
repartizată după caracteristica E: A NN N 
modalităţile: rocker, metalist, [1 „Apetrei M. 
„ meggae-ist, „simfonist” (adică | 2.Zlivog P: | 
adept al muzicii simfonice). În | ` 


acest caz modalităţile mu sunt | O O | 
incompatibile (un rocker poate | 77T1:Groza O. | 
o agrea la fel de bine şi muzica p-ta een | 
simfonică), aici nu sunt | 


exhaustive. (sunt destui studenți : | 806778.Cosin V. | aña ; 
pasionaţi - de muzica N RIBES 


e 


| remita e. AI RY bir 3 
| reciproca condiţiei de incompatibilitat nu este. valabilă, “Altfel. spus, unei 
modalităţi fi pot corespunde : mai multe elemente din cadrul populaţiei. | 
„Numărul de elemente (indivizi) « care corespund unei modalităţi a caracteristicii 
„. constituie aşa-numitul tiv (frecventă brută, frecvenţă absolută) al (a) 
modalităţii respective. Este clar că, dacă sunt respectate. condiţiile menționate 
mai sus, suma efectivelor. modalităţilor va fi e ca. dal total de 
elemente din populația det bază (pa tab.1. 3). des bas 


FT se disting. două categorii « d caracteristici: calitative $ şi cantitative. | 
Criteriul de diferenţiere îl constituie, de regulă, posibilitatea. şi/sau sensul 
„calculării mediei aritmetice a. modalităţilor. i cală 

Caracteristicile calitative pi fi, la rândul lor, de două feluri: 


| nomitiale, la care modalitățile sunt exprimate printr-un. substantiv : sau un cod 
(de ex. caracteristica „sex” din tab.1.2) şi ordinale, în cazul cărora | 
modalităţile reprezintă ranguri : ale fiecărui individ în raport EN caracteristica | 
„respectivă (de ex. caracteristica „poziţia pe lista admişilor”, după care poate | 
4 fi repartizată populația studenților anului I Geografie, anul şcolar 1993/94). 1 
Caracteristicile cantitative sunt cele la care modalitățile sunt | 
și exprimate prin numere. Drept urmare media aritmetica a modalitátilor | 
“caracteristicii poate fi calculată şi, „spre deosebire de. e caracteristicile calitative A 
| ordinale, are un sens intuitiv. A 
. Caracteristicile cantitative pot fi si ele grupate în în funcţie de mai i 
it criterii. 
„Astfel, după cum valoarea 0 (zero) a modălitţilor indica sau nu | 
absenţa fenomenului, ele pot fi: 
| == de interval (reperabile pe o , scară de intervale) - — sunt. acele | 
| caracteristici cantitative care permit precizarea poziţiei fiecărui element al | 
„populaţiei în raport cu o origine arbitrară. Deci valoarea 0 este convenţională | 
si nu semnifică absența fenomenului. Exemple: altitudinea, temperatura, | 
latitudinea, 'ongitudinea ş.a.; -d 
=- de scară (măsurabile pe o DW ii — la care juloarea, O: 
a modalităţilor nu este convențională, ci are un sens concret, respectiv | 
"absenţa fenomenului. Exe.nple: precipitaţiile lunare ( pentru populaţia | 
„precipitațiilor atmosferice la o staţie meteo), producţia de cereale pragu 
| populaţia statelor lumii) etc. 
| „O altă grupare a caracteristicilor cantitative ine cont de semnificația 
j sumei valorilor medalităților: i 
i „* de stoc — la care suma menționată are o aik Pee af de 
ex. numărul de locuitori, o iiie numărul de zile cu diferite 


La fenomene meteo etc.; 


¿gr PO: de raport - — în cazul cărora suma Ara modalităților (valori... 
obţinute, eventual, prin raportul a două mărimi)-nu are un sens fizic, concret. | 
= de ex. densitatea populaţiei, exprimată în loc./km?. i 
În sfârşit, o clasificare uzuală în statistică este cea întemeiată pe. 
y proprietăţile aritmetice ale modalităţilor. După acest criteriu se deosebesc: 
| "e caracteristici (cantitative) discrete, ale căror modalităţi pot căpăta 
| numai anumite valori, eventual întregi, din. cadrul intervalului de variaţie 


i k i posibilă. "Exemple: numărul de zile cu higo A sau cu soare, sar d de copii 
PE e familie, hot de locuitori/comuná etc.; | 
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E caracteristici (cantitative) continui, . ile căror. nodalităţi sunt 
«numero reale si, deci, pot căpăta orice valoare (altfel! spus, o infinitate de 
Valori) în. interiorul intervalului de variaţie. Exemple: densitatea populației, 
"producţiile agricole. sau- industriale, durata anuală d strălucire a soarelui, 
i preiei atmosferică, temperatura ete. 
HA De remarcat că unele caracteristici piatră cum ar G, dé AN g 
13 numărul de locuitori ai unităţilor administrativ-teritoriale, pot fi asimilate cu 
„nişte caracteristici. continui atunci când numărul modalităţilor este foarte. 
: mare. În cazul lor metodele de prelucrare statisticá rezervate caracteristicilor pe 
discrete sunt greu de aplicat, încât se PANA la metodele spacing pentru 
“cari acteristicile continui. 


a Variabila statistică | $ | : DA da: 
| „O caracteristică (cantitativă) die cărei modalităşi pot pi ps 
„modificări, În timp şi/sau spaţiu, ca nivel de dezvoltare (i.e. . 
ca valoarea numerică), sub influenţa diverşilor factori ce 
- acţionează asupra poplației. statistice, poartă numele de i 
| variabilă statistică. — = 
De regulă nu se utilizează termenul „variabilă” atunci când este Poe despre 
“o. caracteristică calitativă; dacă totuşi se utilizează, „atunci se „adaugă. 
| determinativul specific („variabilă calitativă”). 
“Trebuie menţionat că aproape toate E Pt, e cantitative ale i 
populațiilor de date geografice al însuşirea menţionată î în Asta de mai sus, q 
| deci sunt piste variabile statistice. 


. NM Distribuţie (repartiție) Statistică | | 
=` Ansamblul: ordonat al modalităților unei caracteristici be) 
poartă denumirea. de distribuţie (repartiție) a populaţiei ied 
după caracteristica respectivă sau, mai scurt, distribuţie Zi, 
- (repartiție). statistică. 
Mai. ales la populaţiile numeroase, pot exista mai. i multe elemente care 
„prezintă o aceeaşi valoare a modalităţii caractezisticii cantitative şi care 
formează. efectivul modalităţii respective. În acest sens se vorbeşte despre 
| tiag statistică ca despre o tae A de TRE, În cazul a acesteia 


ordonate aie Mă e după valorile modalitățitor respective (vezi tb i, 2. | 
Analiza statistică se eg exercita şi asupra e mel de ; 
frecvenţe ale unor a a (i y 


caracteristici. "Tabel 13. “Tabelul elementar art dea distributi. de 


y (variabile) frecvenţe Petru. 9 variabilă itativă, respectiv - 
| calitative. . În “calitativă. | EIA O ar dE 


' cazul acestora p m rara Soa mari 
al ordonarea, de. | Caah x RÁ B end A | Efecti 
re g o da a A bc dd lo. e | (calitativă) |: e 
yl descrescătoare, nu w dă hs sedas i lib adio <a 
se poate. face |. 
„după. valorile |. 
(non- numerice) Lo aae 
ale: variabilei, CO E 
„după: frecvențele | 
- corespunzătcare N 
„Gezi tab.1.3). | 
Elementul prin” | 
“care. repartiţia |: >o 
o, unei variabile de | 
_ tip calitativ intră 
în judecățile |. 
© statistice este. 


h frecvența. Orice 


posta unei modetiaţi ponte fi de n măi i multe e feri, în fine de e moduli în care este x | 
e determinată: da E 
| — - efectiv 3 sau frecvenţă brută = “umărul de indivizi ce torppia modal $ 

i respective; de i 
N n frecvenţă relativă = = piei tatuat procentuală, a , efectivului u unei i modalităţi 

dia totalul N al indivizilor populației. E 

piu dd „Fiecare dintre aceste două tipuri pai fi, la rândul său, seda feluri: MN 
LA n ada all care cobalt fe Gâtăcate, Mpate Eo 
„de celelate modaliăţi ia te 4 < 

i o frecvență cumulará, care se ds prn cumularea osien ed e 
ale tuturor modalităților care, în cadrul șirului ordonat de modalităţi, sunt anterioare e piata) q 
hd Pete care se calculează frecvenţa cumulată, ` | det | | 


comparaţie sau eventuală asociere (relație; ‘niro ocio alitative, sunt 
precizate prin metode statistice care > iau în considerare frec ovențele diferi telor 
modalităţi ale variabilei E | HR | | 


m Prezentarea unei distributii i statistice ii 
| „ Există două forme principale de prezentare a unei ; distribuții 
"statistice: sub formă de tabel statistic sau sub forma unor reprezentări grafice, M 
cel mai adesea de tip histogramă. Ele au menirea de a oferi un rezumat | 
numeric sau grafic: al repartiție! după o caracteristică, prin, regruparea. $ ŞI 
stabilirea frecvent elor fiecărei modalităţi a caracteristicii. În cadrul acestei 
T etape de prelucrare 2 “dateior empirice se urmăreşte, deci, să se 
“răspundă la întrebarea: câte elemente din populația de b: ază cope í fiecărei + 
modalitai! sau fiecărui grup de modalităţi? | j 
> Tabelul de distribuţie a frecvențe gelor modaliSifilor unei caraciaitistic 
este un tabel statistic Pon (numit şi „tabel cu simplă intrase”) a T 
machetă are două coloane: prima destinată înscrierii modalitáfilor 1 
caracteristicii, iar a doua — înscrierii frecvenței. (efec tivului) fiecărei 
„modalităţi (prani ilustrare vezi tab. 1.3, care include forma generalizată a 
unui tabel de dist ributie a frecvenţelor pentru două tipuri de pasacțeriețici, j 
motiv pentru care are 4 coloane). Îi: E 
i Histograma. este un sa al repartifici pe clase de pt PL y 
dintr-o. succesiune de dreptunghiuri (coloane) alătura ate ce au suprafejele i 
proporționale cu frecvențele claselor corespuuzátoare (vezi fig.1.3). Ca formă 
-de prezentare a unei distribuții de frecvente ea prezintă avantajul că permite 
0 comparare mai rapidă şi mai precisă a frecvenţelor diferitelor modalităţi, 
j dar şi o geen, mai PE a A de podala cu frecvenţe 


$ esența acestei prime étape de: ión a datelor de Pier în vederea prezentării j 
distribuției sub formă tabelară, este bine surprinsă de terraenul corespunzător 1 în literatura mp . 
y specia baia franceză: „tableau de dénombrement” ii de parinte 
24 În cazul variabilelor cantitative continui cu număr. ul mare de ciel de 
j procedează, pentru reducerea volumului de muncă, la o grupare. a modalităţilor în ciase de ` 
valori, urmând a se determina frecvenţa fiecărei clase prin numărarea elementelor ale căror 
valori sunt cuprinse între limitele clasei respective. Noţiunea de „clasă” este utilizată curent în 


¿ descrierea distribuţiilor de frecvenţe ale variabilelor c cantitative şi, pna ¡a ale variabilelor f 
„Calitative. | | 


19. 


i - mari/mici din cadrul domeniului de. variaţie a  caracteristicii. 

Modul concret de prezentare a unei distribuții statistice depinde de | 
tipul caracteristici după care este repartizată populația şi de raportul dintre 
numărul de elemente ale. populaţiei (N) şi numărul Ab pn ale 


caracteristici o În felul acesta se diac trei cazuri: de | 


| a) Caracteristici cantitative discrete, sau calitative nominale, având, ua număr 


Tabelul de distribuție v vafi unul simplu, incluzênd, e a facilita | | 


comparafiile între 


frecvențele diferitelor Tabel 1.4. Tabelul distridundl de y € | 
pentru. o variabilă cantitativă discretă sau. | 


"y clase, o a treia coloană 
cu frecvențele relative 
simple exprimate 


calitativă nominală. BRA O 
„procentual sau ca numere | Caracteristica | | rel relativă 


| subunitare (vezi tab. 1.4). | e E O, LA V7 r ca 100| | 


| „Reprezentarea Îi 
grafică uzuală este, ín | 
acest. caz, diagrama în. | 
bastoane (vezi fig.1.2). | 
“Dacă avem de-a face cu. | 
o variabilă diserotă, | 
modalităţile trebuie “| 
- ordonate; la variabilele | 
“calitative nominale nu |: 
„mai contează ordonarea. y p 


pai Candia | 
„ calitative având „numărul i 


Este cazul tipic pentru caracteristicile calitative orelbita; oder apare | 
uneori şi 1 cele nominale care joacă rol de identificatori exclusivi ai 
elementelor populației (de ex. seria PN, peo cial umană | 


dintr-o regiune). 


be. : Întrucât N=n; este clar că nu este nevoie de un tabel de distribuție A 
PE “frecvenţelor, s sau o by i ezitare grafică, pentru pipera distribuției 


0 IT GP TOS, D E 2 


+ one frecvențele sunt egale oni 1). 


na ppm Caz, întrucât sită” modalităților ateu foarțe mare. 
| (potential infinit), operaţiunea de stabilire a frecvenţelor fiecărei modalităţi 
oste practic imposibilă. Din acest motiv, ca si pentru o concentrare NY 
informaţiei oferite de datele brute, devine necesară gruparea modalităţilor în ` 
 clase!; prin numărarea elementelor ce corespund modalitátilor din interiorul i 
„ claselor se determină pă bn Via acestora din urmă. | | 


| PRS modalitáfilor. caracteristicii pe. dacă de valori trebuie să 
respecte următoarele reguli: =- , 

e reuniunea claselor (privite ca 2. de valori) dies să acopere shi 
cel puțin domeniul de variație al caracteristici (condiția de exhaustivitate); 
altfel spus, valorile extreme trebuie. a incluse în clasele E 

corespunzátoare (clasele extreme); i 

IE ə clasele de modalități să fie două câte: două disjuncte, astfel încât 
intersecţia lor să fie nulă (condiţia: de incompatibilitate); altfel spus, limita 
“superioară. a unei clase nu poate fi identică cu limita inferioară a clasei 
“următoare. Această condiţie este necesară pentru a evita situaţiile în care una 
Şi seci valoare, egală cu cele două limite, este inclusă î în două clase vecine. | 


E Exemplu. Se cere a distribuției de pura paar Variatio - 
s Aa ai medie zică în luna iunie” Dg is ge) germ gi pra 


| 1 prin a clasă se bid o mbdiviziuos a a idilă de variaţie a a variabilei. Pentru Clasele í 
' constituite din grupe de valori trebuie determinate elementele caracteristice ale acestora: limitele —€ 
(inferioară şi superioară), amplitudinile claselor (care pot â egale sau inegale) şi centrele claselor 
(valorile situate în. mijlocul claselor, ca medii aritmetice ale celor două limite de Jm. o. 
- schemă simplă ar putea facilita înțelegerea acestor noţiuni: 


clasa 1: [li.C da], iar as zl; 
clasa 2: (la.. «Ego. ah Jar TORF 


pe Ih: je, o x eb ET, 
: Semnificaţia notaţiilor: 1, — limita inferioară a unei clase; L — limita superioară; c — centrul de 
„Clasă; a — ka e clasei. o visati arca Ri Ati pă al. i 


datarea 1971-1990 (20 [7 
x 30 zile = 600 de | 
valori). Pentru aceasta se | 
procedează la împărţirea - 
intervalului total de 
variație în clase de 
„valori. Analiza valorilor 
din şirul iniţial sugerează | 
o amplitudine a claselor |. 
„de 5*C; în condiţiile în i A Pr: 
care. valoarea - minimă | rangul náscutulvi viu 


este de 6,5*C, iar cea Figura 1. 3, Repara náscutilor vii după a: 
maximă de i 34,2°C, născutului viu în România, d 979 > quad Y. V. Trebici 


aceasta permite separarea « colab., 1 98). 
“unui număr Ha 6 fina de 
aii 


6, o, :10 O]; ao, o, 15, 5,0]; (as, O, :20 0], 0, O, 25 0); (25,0 O, 30 0); (0, 0, 35 w $: i 


Se observă ca sunt sati pliată ambele condiţii de mai sus. Astfel, cele două E 
„clase de la extremități includ valorile extreme de temperatură, iar condiția de 


incompatibilitate este satisfăcută prin modul de delimitare a intervalelor de 


“clasă: interval deschis în cazul limitelor inferioare, respectiv închis în cazul 


limitelor superioare, La. acelaşi rezultat practic. (satisfacerea condiţiei de 


| incompatibilitate) se ajunge dacă, lăsând intervalele de clasă închise la ambele 
„capete, se stabilesc. limitele inferioară, respectiv superioară, ale claselor 
succesive în aşa fel încât ele să nu coincidă. În felul acesta clasele din 
exemplul nostru se modifica astfel: (5,0. .9 ,9), :[10, 0..14 eow .:[30, 0..34,9] 


(vom fine. cont de faptul cá temperatura aerului se exprimă î în grade şi zecimi, 


„astfel încât orice valoare din şir va fi inclusă î în una sau alta dintre clase, 


„neexistând pericolul de a rămâne vreuna pe dinafară). 


- Construcţia tabelului de distribuţie este asemănătoare cu cea de la 
pi (a), cu deosebirea că în locul "modalitátilor individuale apar acum 
clasele de modalităţi. Pentru caracterizarea completă a distribuţiei de 

y frecvenje i în tabel se mai introduc două selvas, i i ER | 


es a) 


e cumulate iii debo descendent! (vezi tab. 1, 5). 
E Reprezentările grafică u uzuale Sunt, în acest caz, histograma şi 
A oai ci rr Dart dea a i 


i e (vezi fig. L sg 1. Hy se construieşte într-un sistem de i 
5 coordonate canga pe aca se treo valorile care delimitează clasele, 


Tabel 1.5 . Tabelul de db distribuție, a frecvenţelor pentru o variabilă ali vá 
4 continuă sau una discretă cu număr foarte mare de modalităţi. - 


some aa mesero 


| Caracteristica | Efectivul | Frecv.relativă Frecvența cumulată 


= ANA 100 


„ascendent - | descendent ye A 


ho af LAA [fed =100 | 
ho o Peas feat, |. 


e dale afet Vfedi= dt 


iar pe ordonată atare e NET | ojos aleta Pui - 
Ñ Atunci cánd clasele au o amplitudine constantá PHE ASE aa au 
-lățimi (baze) egale, iar înălțimile lor sunt proporţionale c cu Fpevpatsie, de | 
„Clasă. 3 
În cazul distribufiilor cu clase de molidas: variabilă, însă, relația de: 
prer rigos trebuie e la ES MRT, nu la e | 


pra a cumularea fobii relative stinge se numeşte ascendentă, respectiv S6scesdzlă ta E 
_Taport cu ordinea (crescătoare) a claselor de valori din tabel. De aceea în tab.1.5 frecvențele + 
~ Cumulate ascendent se succed de. sus în jos (în sensul creşterii valorilor claselor), iar cele . 

| Cumulate descendent se. succed de j jos în sus m sensul descregterii valorilor claselor). | 


ináífimile lor, - | | 
„Soluţia E a ral E 
probleme „constă “ 

alegerea unui taca. | 
etalon de clasă, a cărui 
amplitudine (de 
preferință unitară) să fie 
“divizor comun sl 
amplitudinii tuturor 
celorlalte clase.  Câtul 
dintre amplitudinea unei 
clase oarecare şi 
| amplitudinea  clasei- 
etalon, calculat atunci 
când amplitudinea clasei- 


inte abat Geogra generală. 


Figura 1 3. “Dismibugia or 30 En studenți ai 
"anului! Geografie după nota obținută la: 


etalon nu este unitară, serveşte la > rin impártire) no arii de 


clasă la frecvenţa clasei-etalon, rezultánd aşa-numitele „frecvenţe medii” 


(Vezi tab. 1.6 şi fig.1:4-b, în care amplitudinea clasei-etalon este egală cu 1). 


hn felul acesta dreptunghiurile histogramei, cu lățimi (baze) inegale, întrucât 


| _ proporționale cu amplitudinile claselor corespunzátoare, vor avea înălțimi 
| PAS cu ii reduse ies ) aferente claselor ps. | 


“Tabel 1. 6. Tabelul de TORA a coil pentru o caracteris isticd Y 
cantitativă continuă sau una discretă cu număr foarte. mare de modalităţi, . 
cazul claselor cu amplitudine inegală: rata dp în departamentele | 
regiunii Franche Comte, Franța, în 1982. 


 Caract. Xp Amplitudinea, | Raportul Efectivul Frecv. zoni Freov. see 
e qa e > | 
somajului, PH i 


O 
16,8,5) 
B, 5; HO 


ză Prin unirea oe SA i: PE | a ale. 


24 


E f 
E _cumulată E 


A dreptunghiurilor se “Shit o ieri fină cunoscută sub pre, de 


„poligonul frecvenfeló;” (vezi fig.1.3). Suprafaţa cuprinsă între. linia 
- “poligonală şi axa absciselor este aproximativ egală cu suprafața histogramei ie 
„- (egalitatea perfectă există atunci când . numărul de clase este infinit). i 
+= Poligoanele frecvențelor se utilizează frecvent pai end e. al i 
T pe ring grafic a mai multor pre ionii | 3 


bie Curbele cumulative s se construiesc la feic ca si isogreee, c cu două | 
| „ deosebiri: si 
— se folosesc o frecvențele cumulate (ascendent sau u deseado) în | 


= - 5% Ajaan sibi: | 
sagrinar 100R A 


Er Ta, E Hogana unei zo de frecvenţe cu clase de amplitudini — 
` egale (a) şi inegale ar no dat pre ag is aie 
E locul celor simple; * ud BC die ati a da a 
mal rare ia e i | 
la partea lor superioară; acestea se unesc apoi Prigp ii: verticale, ceea ce 
` conferă curbei cumulative aspectul specific de curbă î în trepte (vezi fig. 3). 


| Atunci când numărul de clase este foarte mare graficul în trepte tinde către. | 


„0 curbă “„netezită” având cp mia forma t literei $ S, hr saagi S gos le 


pile - dă 


analogie. de fo: al po ate fi făcută şi cu pila ui matematic pentr tru integrală 
Cf) cu atât mat mult cu Cât, în sens matematic, curba frecvenfelor cum ulate 
ascendent amprezintá integrala curbei frecvenjelor, „simple! (în, cazul 
- distribuţiilor cu număr infinit de clase). alia d Mia! î 
Curbele. frecvențelor cumulate permit, ca şi histogramele, 
| lnea în cadrul intervalului total de variaţie, a claselor sau grup: elor de 
clase cu frecvenţe mari (pantă mai accentuată a curbei) sau mici (pante mai 
„ reduse). Dar importanța lor de osebită pentru analizele statistice rezultă din 
faptul că ele perei aflarea răspunsul ui la două întrebări NE pante: | 


HU) i 2) care este proporția (s: au i frecvenţa, sau, la limită, probabilita tatea) | 
„cazurilor cărora le corespunde o modalitate inferioară sau superioară unei | 
anumite valori-prag? i, 7 nia iie 
Din fig.1.5-a reiese destul de clar, ciódom, modul de r PRA a acesiei 
Hi problerze: fiind dată nota-limită 7 „50, din grafic rezuită prin citire directă că - 
71% din studenţi au note mai mici, sau cel mult egale cu aceasta, în timp ce 
diferenţa până la 100%, adic că 29% s din studenți, au note mai mari decât nota- 
limită. Dacă distribuția ar avea o infinitate de clase, atunci am putea. spune 
— trecând de la noţiunea de „frecvență la cea de probabilitate — că 
probabilitatea unei valori mai mici sau cel mult egale cu 7,50, numită 
probabilitate sau asigurare de nedepăşire, este de 0,71 (sau 711%); 
„probabilitatea complementară, numită protabilitate s sau asigurare de a citeai e, 
„va fi de 1-0,71 = 0,29 (sau 29%). 

i Deoarece graficul din fig. 1.5-a permi'> citirea direc a asigurării de 

| nedepăşire, el mai poartă denumirea de graficul. (curba) asigurării de 
nedepdsire. Prin comparaţie, curba cumulativă descendent din fig.1.5-b, care 
„permite citirea directă a asigurării de depăşire, se mai numeşte graficul ` 
(curba) asigurării de depăşire sau pur si simplu grafic (curbă) de asigurare 
(denumire să citita curent în n hidrologie si climatologie). | 


b) care este A pă (valoarea) ERa îi corespunde O nicole 
„dată a cazurilor cu valori inferioare sau superioare modalității respective? 
Este clar că pentru rezolvarea acestei probleme demersul . este invers: 
po „proporţia (frecvenţa, probabilitatea) se identifică pe ordonata graficului, iar 
„valoarea căutată se citeşte direct de pe abscisá. Dacă se utilizează graficul din. 
fig.1. 5-a, atunci valoarea găsită este aceea faţă de care proporţia dată include . 
„cazurile mai mici, sau cel mult egale cu aceasta (urmând ce diferenţa până 


“ee. 
AE FA 
i 


b E e E o r . r rr 


„40 
o f=238| ( 
$ 20 p e cnosnonnvelcc.osoeeo.... 


> On Aia ion 10) i an e pu 


a aaa ap ap aa 


„aura 1.5, Curba cumalativă ascendent (a) qi descenden W. 


la 100% să includă cazurile mai mari ca valoarea respectivă): su graficul din 
fig.1.5-b, proporţia dată include, dimpotrivă, cazurile mai mari sau cel mult | 
. egale cu valoarea citită direct de pe abscisa graficului. 00 2 0 

- O problemă foarte importantă, asupra căreia trebuie insistat, este. 
aceea a stabilirii claselor de frecvenţe, deoarece de aceasta depind atât 
prelucrările ulterioare, cât şi corectitudinea rezultatelor şi a interpretărilor 


acestora. În legătură cu această operaţiune fundamentală două aspecte au un 
rol deosebit: stabilirea numárului de clase și fixarea limitelor claselor 


„„ 2) Stabilirea numărului de clase. Numărul de clase. depinde, în 
„general, de numărul de modalităţi ale caracteristici (numărul de valori din 
- sir). Nu putem grupa 30 de valori în 10 clase (o medie de 3 valori/clasă), 
„Căci frecvențele ar fi prea mici şi nu ar putea să sintetizeze distribuția 
“Statistică. La fel, fixarea unui număr de 5 clase pentru un şir de 3000 de 


valori este inacceptabilă, căci acest lucru ar simplifica grosier repartiția, — 


„ ducând la o pierdere de informație: —€ pe Ca ete 


mei malg statisticieni recomandă un pumir de calit cuprins între 7 si 15, i 
Unii au încercat si X. păsească o soluție matematică acestei probleme, ajungind E 
„la nişte formule, orientative de calcul. lată doua za JO | 

| — du partii A sală ia a | A 
i ka 143. 3» z oz); 

- relația Brooks-Caruthers: 

i ke H Sx lg(m) . 
în care k = numărul de e clase, n = efectivul total al modalităţilor (ar de 3 
v alori din sin). | 


b) Fi ixarea mein claselor (si, implicit, a sentisadinilor de clasă) i A 


A este o operafiune hotárátoare pentru sintetizarea corectă a distribuţiei valorilor 
în cadrul intervalului total de variaţie. Pentru a se limita cât mai mult erorile - 
cauzate de împărţirea în clase se urmăreşte, de obicei, respectarea a două 
reguli: limitele claselor să varieze regulat, iar repartizarea valorilor pe clase 
„să fie cât mai uniformă. Din păcate, cele două cerinţe sunt antagonice: dacă | 
"se stabilesc limitele de clasă: ca termeni ai unei progresii regulate, se obțin — 
frecvent fie clase: vide (dar, din motive. de corectitudine a prelucrărilor 
ulterioare, se recomandă ca efectivul unei clase să nu fie mai mică de 5), fie 
clase foarte. „aglomerate”; dacă se încearcă o repartizare uniformă a valorilor 3 
pe clase, atunci limitele succesive nu urmează o progresie ojus rezultând, 
a cu amplitudini inegale. | | 
- Tnegalitatea amplitudinilor Je clasă atrage după sine imposibilitatea E 
| detali directe a frecvenţelor claselor. În acest caz se calculează aşa- 
numitele „frecvenţe. medii”, ca raporturi între. frecvențele de- clasă şi 
frecvenţa clasei cu cea mai mică amplitudine (numită „clasă de referinţă”), 


"acestea vor: fi apoi utilizate în prelucrările ulterioare şi în construirea 


E abia de distribuţie (histograme şi curbe cumulative). 

E „Este clar că stabilirea unor -clase cu. amplitudini apaken atică la 
i creşterea volumului de munci 1 în vederea alcătuirii distribuţiei de frecvenţe. 
De aceea se va evita, pe cât posibil, această alternativă de lucru şi seva 
încereca. fixarea” unor limite de clasă care să se succeadă într-o ante ; 
tegula. | RE A e 
„Cele mai utilizate progresii sunt progresia aritmetică; progresia l 


- A j MPa si cea pătratică. Cu ajutorul lor limitele se pot stabili precis, A 


i y utilizând valorile extreme şi numărul de clase. 
A Es ai cazul: progresiei aritmetice- diferenţele dintre două limite 1 
a succesive, respectiv amplitudinile d de clasă, sunt constante s se ue in felul : 


“e rmătorii +, 


m 
a = M-m A 

Ten a = amplitudinea Gi rata progresiei, în e aes timp), M = Valoarea 
"maximă din şir, m = valoarea minimă, k= numărul de clase. Limitele 


obţinute 1 vor fi respectiv m, m-a, m+2a,. ., m+ka= M. Neajunsul principal si 
al acestei metode este că detaliază în mod exagerat zona valorilor extreme din 
şir (acolo unde, de regulă, exista un număr mai mic de valori). e 
— în cazul progresiei geometrice limitele de clasă succesive se obțin 
„prin. înmulţirea cu un peon constant R. Acest spog a, o. se 
calculează astfel: i | 

. "Ef 

bre tele + (m>0, 
ar limitele vor fi de forma m, Re m, R?+ m, Rm, ., Ro m=M. Neajunsul 
_ acestei metode este acela că detaliază, în cadrul distribuţiei de frecvenţe, zana 
„valorilor mici, iar amplitudinile sunt inegale. În plus, metoda nu se poate 
- aplica decât dacă m este strict pozitiv. Pentru uşurarea calculelor se poate. 
valorifica faptul ca logaritmii limitelor urmează o progresie aritmetică — deci | 
limitele vor fi de forma log(m), log(im)+log(R), log(m)+2 * log(R) etc. 

=- — progresia pătratică, prin proprietățile sale, elimină dezavantajele 

primelor două. Limitele succesive se obțin prin ridicarea la pătrat a 
termenilor unei i progitsji aritmetice la care rafia se calculează cu formula: fe 


| d EN pă a So La a | 
4 rezultând seria: m, ( Pa pp NE +2P)?,. U am. 


| În general vorbind, progresia aritmetică et aplicabilă mai ales în | 
ai caza distributiilor uniforme sau/şi simetrice, pe când celelalte două sunt utile îi 
- în cazul Po asimetrice . | SE 


1 ia nivelul acestui prim capitol simetria/asimetria unei distributi de ina i s-ar putea 
-defini astfel: spunem că o distribuție este simetrică atunci când clasele cu cele mai mari frecvențe 
„20 grupează spre mijlocul intervalului total de variație; dimpotrivă, distribuția este asimetrică 

„ atunci când clasele cu frecvenţe mari se grupează ee | 
„(e în zona valorilor mici, fie în cea a valorilor mari). 


` Odată fixate. ital de clase, Hell e si amplitudinile acestora, se. 
dclacicial efectivele, frecvențele. relative simple (sau medii) şi cele cumulate. 


mk si, pe baza acestora, se construiesc histogramele $ si curbele culmulative, Asa 
CUM :S-2 menţionat deja, se obişnuieşte ö „netezire” (ajustare) a poligoanelor 4 


PAS următor. | 


i frecvențelor, respectiv a curbelor cumulative. Curbele ajustate se compară, 
i apoi, cu nişte curbe teoretice în ceea ce priveşte numărul şi poziţia, îsi cadrul. 
intervalului de variaţie, ale claselor cu frecvenţă maximă. Din acest punct de 
- vedere se pot întâlni mai multe cazuri tipice de curbe alo. dro 0 relative 
vu simple/medii (vezi fig. 1. 6): 
| bre curbă în i formă de aii (ea un singur | maxim de frecvent) si 


arre pain AE A 


pa. cmb) | 


9 95057 SE oo 1057 ¿gas 1008 pur 1014 or 


9.1. 0 304 0 6- 
en DE E 5: o 07 Mio 


stă Ta Y 6. | Türev forme tipice ale uinor curbe de distribuție a a frecvențelor 
; e în geografie. SIR Fes 


¿E "mierea — în acest « caz , distribuția se numeşte unimodală!. şi i seriei 
de apropia ca ca formă de aşa-numita curbă ce sau Sie aug lui Gauss” 


noțiunea de mod sau valoare modală a unei distiuji statistice va ñ discutată î în pie 


3 îi 


- plurimodale sunt cele la | 


| „multor maxime indică, 


(fig. 1.6-a: presiunea atmosferică medie lunară). Curba normală este o curbă 
„ teoretică fundamentală pentru Statistică şi asupra ei vom reveni pe larg într- 

„unul din capitolele următoare; “Tei natala ah a GR NET a ie 
-0 | b)icurbă în formă de J sau J întors, cu maximul de frecvenţă în 
„imediata apropiere a unuia din capetele intervalului de variaţie (fig. 1.6-: 
„ Presiunea atmosferică minimă absolută lunară; fig.1.6-d: debite minime. 
- lunare ale ale Bahluiului la Iaşi, 1956-1992). Este un tip de curbă destul de 
„. Táspánditá în geografie — de ex. la distribuțiile de frecvenţe ale cantităților 
„. zilnice de precipitaţii (majoritatea dintre acestea fiind, de regulă, sub 1 mm). 
<  Asimetria unei astfel de curbe este maximă; bat RBS, al ia ras eta 
€) curba unimodală cu asimetrie intermediară este cea mai frecventă 
în cazul distribufiilor de Co | 
frecvenţe ale variabilelor  [——— 
„„ geografice  (fig.1.6-b:. |. 

„umezeala relativă a | fs, 

„+ aerului — toate datele | |: 
„ „meteo sunt pentru staţia . | 

„Iaşi, 1961-1992) “| | 
„dy curbele | 
bimodale sau chiar | 


O de A, | NE Naco ANO cripeom 
„„multe mazime de | ~ ni il zale A E reie is li ORI RDI 
„„ frecvenţă. Prezenţa mai | O00 PEE Sau i 
GEO Figura 1.7. Distributia țărilor lumii după. 
$ regulă, un amestec des consumul zilnic de calorii pe cap de locuitor. ` 
„Populaţii diferite. în PT E ARS AAN bei 
cadrul 'eşantionului te 
prelucrat (fig 1.7, 2000 A e E ir? Bz a AM A 
-` €) curbele amodale sunt cele la care nu se evidenţiază clar unui cau 
„mai multe maxime de frecvenţă. În această categorie pot fi incluse curbele in 
„formă de U (a care, deci, maximele de frecventá sunt plasate la extremităţile 
_ intervalului de variaţie. EA e te AAN i ua a 
„Toate tipurile de distribuții statistice cărora le corespund cube de - 
Mai sus pot fi caracterizate numeric cu ajutorul unui număr relativ reci de 
„indici (parametri) sintetici care permit două operaţiuni de bază în analizele 


„Statistice: 0 


qe compararea între cele a. curbelor $ i implicit, a i disribaților 


| “corespunzătoare; Are 


2 com mpararea, sit ew niste curbe (distribui) 4 teoretice, care 


4 joacă rolul unor modele. de referinţă. int x 
mes. SE pa au ta is. A P AN , 


CAP.IL. ip pita STATISTICE, 


| Pentru ca racterizarea reia. sinte stică « a unei dini» statistice 
f implicit a a curbei de distribuţie corespunzătoare, se determină patru tipuri de 
|P para metri (indici), fiecare tip. descriind anumite caracteristici ale acestora: 
o: “A parametrii de nivel, numiţi deseori şi parametri ai tendinței 
-:centrale sau valori centrale/ Sunt numiţi parametri „de nivel” pentru că ei 
exprimă nivelul până la care. se dezvoltă: („urcă”) ansamblul valorilor 
al distribuţiei; „valori centrale” deoarece ei se. plasează, îndeobşte, în zona de 
„maximă concentrare a valorilor (zona frecvenţelor maxime), astfel încât 14 
i lg lor se plagează, la distanţe mai mari sau mai mici, celelalte valori diñ H 
ja “m parametrii Po care > exprimă gradul & de  impräştiere : 
valorilor din şir în jurul valorilor centrale; Dai | | 
pa = indicii de asimetrie, care exprimă asimetria aller de distribuţia | 
| adică măsura (cantitativă) în în care maximul de frecvenţă este „deplasat spri | 
a stânga sau spre dreapta faţă de centrul intervalului de variaţie; e a ER + pe 
E indicii de. exces, care exprimă. numeric gradul de. grupart 
T PRAF Sry a valorilor din şir în apropierea valorilor centrale// de aici 
"+ decurgând forma mai rii san, dimpotrivă, mai ga i a curbelor de 
A distribuţie, + | 
d Deoarece se tefe Esplicit la curbele de dildo; i aci două Y 
tipuri” de parametri: sunt Pin, uneori sub denumirea ae ri san formei 
| «ist de distri tai, A | dae OS 


sa 1. Valorile centrale ` 


Tri sunt pile li tendinței centrale care suni i mai i des utiliza în | 
| analizele statistice: ERANA “mediana şi media sa zi A nat 


B 


că de Es 
A Piu 


2, 1 1. Modui i (ou moda, sau n valoarea modal) o) 


Den ka hal. curiclorieticilor calitativă s sau cantitative discreto, doii este | 
le valora dominantă din şir (valoarea cu cea mai maro Pepee) şi ea se 

9bfine direct din tabelul de distribufie, - SE af RU J 
a + În cazul distributiilor cu clase de paii CI, satitativa d 
a continui). se. vorbeşte, despre o „Clasă modală”, care este clasa căreia îi 
„corespunde. cea mai mare. frecvenţă. / Valoarea modală se calculează cu ` 
< ajutorul unei formule care ia în considerare atât clasa modală, cât şi clasele 1 

Coo vecine acesteia/ f formulă bazată pe principiul interpolării liniare (în ipoteza c că. 
| „Valorile si sunt it uniform distribuite î în interiorul clasei modale): | 


a pina: Mo si, a, + A, “amy ej căi, E Ra 
aA A “Sun o) muie “i iar A, Luo Saon S Simbolurile folosite 
| ca Papas A Ta A a Mau aa i, 


G Ato — Jill inferioară a last. module; ` | 
any agil frecvenţa clasei modale; .. mai i aa 
i IR e oy = frecvenţa clasei. de, dinaintea celei modale (clase find | 
i - orton crescător); ei ia o a ie a st ii ja ia Arca = 
o Lots p= frecvenţa A mal de ha cea: a modal des a y i E 
dm — amplitudinea clasei modale. atei psi ci tal gat o A 
d Prin. comparaţie cu celelalte: valori centrale, modul prezintă unele | 
„mea dar. şi uneie- dezavantaje. A : iai imediat E ate det ocd a al 
ds Avantaje: a de St ai a tă aia da 
AG EFE este. singura sila i centrală c care ponte. “i determinată i în. 
e reciclar calitative nominale — de aceea este. deosebit . de 
E important pentru geografie, unde se lucrează deseori cu date de acest tip; . 
Se „e este util atunci când se urmăreşte reliefarea unei trăsături, 
$ damingni a fenomeno analizat pe baza datelor de. observaţii — de ex. 5 
| suprafaţa lacurilor dintr-un teritoriu, sau numărul de locuitori /comună, unde 
- -modul poate indica predominarea unei categorii sau alteia de mărime, în felul .. 
„acesta „modul poate fi expresia unei structuri: spaţiale ce caracterizează o: 
A ` regiune, căci él posie traduse o dominantă î în climat, ; peisaj, economie eto.” 
El „(Chadule, 1974). a 
SS „ Dezavantaje: 


i în nică este eoat htimaj de freoven, modul r nu a reuşeşte 
| să caracterizeze sufici tent o distribuţie; fetei Ad | 
Dios „e poziţia ŞI, eventual, numărul a nd 2 le! epi 
A oaste mult de modi ul de grupare în clase: O: schimbare a numărului. de clase 
è E ae a limite elor acestora poate provoca modificări dramatice în acest sens; 
-RE ia o ja unek distribuții statistice este posibil ca modui să nu 
“existe, altfel spus nu se pune în yido o loto sau o clasă peas cu ; 
frecvență maximă; $ | 3 ai i i 
4 e prin felul cum se pe termină, A idea imodalá nu posedă 
calităţi aritmetice: bine definite si, eci, nu poate â preluată în calci cule | 
ulterioare pentru deriva area unor PS st supiipieata are ale distribuţiilor - 
Statistice, ăi EPU bă 2 Pau 


| pă 2, Mediara (onoarea r mediană) Gr 


| iiaa este situată HN mij locul. KERON de modalități 
"ordonate, « crescător (sau descrescător, în iinele cazuri), împărțindu-l în două 
¿QA jumătăți egale, astfel încât Jue din valorile Eom 0 se sn deasupra, iar 
An Jumătate dedesubt, / TAR | K | 
A = a „Pe este numită „medie, probabilă”. în in. că. există o 
puii de .0,5. (sau 50%) ). ca o valoare. oarecare din sit sá fe 
: inferioară/supezioară medianei.... 
ee „În cazul şirurilor de valori adidas masea cantitative 
să discrete) mediana se calculează qee alei cum: umărul de valori din sir 


he i (n) este -par sau ucizi pi 


ds q | + > 


y Ad 


“na it a, (auruăe pan: Me = 


po adică mediana este media aritmetica a celor două valori din mijoeui sinului; 
Hr R= 2k+1 (număr impar); Me = De ES 3. i | | 
adică mediana este chiar. valoarea din a pă sirului. 7 


200 În, cazul distribuţiilor cu clase de frecvenţe avem de-a gari cu e. 
de lasă mediană”, „care este gma clasă fin, sensul,  Srescător sau i deterpecătag,, 


T distributiile e cu i un singur 1 maxim de Beau a: tias so se numesc e distribui ră 
Y vnimodale; în cazul. distribuţiilor bi- sau am vom avea ua mod pin sai ul unul, hi 
SHI NO mai i multe, moduri secuii. SAANEN j 


al orcii claselor} la care frecvenţa cumulată. depăşeşte SORÉ Pentru 3 
determinarea medianei se iau în considerare caracteristicile acestei clase, . 
A precum şi frecvenţa cumulată a: clasei anterioare, a de Salca, este e 
b j i 
/ Me = Laso + + eon fm unda 
| Mn 
j ler -= mediana; IA | 
w A -— limita inferioară a olaki mediane; 
E ina - amplitudinea clasei mediane; - did 
Fay — frecvenţa simplă a clasei medianez ` pai 
| fate — frecvenţa cumulatá a clasei dinaintea celei mali 
Avantajele medianei față de celelalte valori centrale: | 
„e prin definiţie, mediana este valoarea cea mai apropiată, 
ca poziţie, de toate celelalte valori din şir; altfel spus, suma distanțelor, în 
„Valoare absolută, dintre mediană şi celelalte valori "e ir « este. minimá, bl 
E ec a care poate fi formalizată astfel: 7. ; 


D - A]. = minim, Pa 
E | + fst i ki 
“i Această î însușire este importants în unele probleme de ordin a practics e BURR 


k Exemplu. 1 péi i unei itoetrazi cu pă de 600 km sunt amplasate i 
BE i a de benzină, conform pri aq mai e | | J 


Py AA mea qu] qQPr plrzyrr > d IRA AAN A TU 


o o a Ro A 600 km 


se cere > să se găsească ră optima a unui dipóricd de BEE în asa fel 
a încât cheltuielile qe Ip e sa os celor 6 atii, să, fie 3 
"Confor repisa ebficñatd! mai sus, niigi optim a 
e depozitului. va fi în punctul ce corespunde medianei celor 6 distanţe 

E il, z al lautas) gy acte dintre acest piere, si la | 


olin cazul variabilelor calitative stă Cenes care se ponte calcula, de asemenea, o 9 $ 


z valoare prnl) relația | de minim nu mai are sens. 


E 


A ip Cunoscută: aus 


“de benzină este de 975 sia mai i led decat s suma PE o orice e alt 
“punct şi. staţiile respective. — “pentru comparație să luăm. punctul ce: 
pies corespunde - mediei “aritmetice spa dă aj de care a ge Lai 

să însumate totalizează 995 km. su E Hd 


> spre ; tiu de ibid huetii: EE die nu este | 
i vena de gal extreme ee habia Ea vana astfel mai i Aa, ai 


2.3, Media a aritmetica: Do | d A pete 


. “Media ci, ape cut PER. cea mai utilizată, “datorită faptului că | 
PS proprietăţi aritmetice clare şi, deci, poate fi utilizată î în calcule ulterioare. 
Pentru irurile de a pi agua, de că este, cea 


Lo 


di ¿Penta distribuțiile, de frecvé | sa 4 acest sala asia se. ER 4 
„e peta a centrelor de clasă i ponderare. cu orale aferente „claselor d 


x a etic 


di, lia în analizele statistice se vehiculează si i alte t tipuri PA medi, înafara lod aritmetice pân. AM 

tămâne, totuşi, cea mai importantă), c cura ac fi: media le bi „media  ătratică, eng, i 
„armonică, media glisantă ş.a. E 
l Din motive de economie. a limbajului mé expunerea Aita i tés dal medie”. se ci | 


referi exclusiv la media aritmetică, ip: tac ca uiad alte gene de medii termenul m fiet beina 
~%  determinativul tra AE g A EA E e 


rgpricinie aritmetice ale mediei sunt APEE 
4 1% suma: abaterilor valorilor din pir de la medie este nulă: 


DOE de | si 
A 2) dacă valorile din şir se modifică prin PAIA aa unei 


constante, atunci media creşte/scade cu aceeaşi constantă: 
x R TOI E SAT =x ta = Verta 


(Be dacă Y este media unui alt sir si pa. sunt diferențele Pi po) ; 
ia pai de maci e ia si 


: i lui ll este utilă, spre doll în dimtoagie şi hidrologi . 

: tata prelungirea şirurilor de observaţii. 

AN. 4% “suma. ad bro io valorilor. aia. sir de la p lor 
e aritmetică este minimă: a d ct W i E | j 


a-si 


Saca Ap = minim, dacă A =X. 


E + Acei popia este larg utilizată i în caloutels ulterioare implicate de ] 
rio distribuţiilor statistice. © A 
DEE Dezavantajul mediei aritmetice este că, întrucât ia în considerație 
S ica de márime al tuturor valorilor, devine sensibilá la valorile foarte mari. 
sau foans mici, Aceste valori extreme pot fi deseori puţin semnificative, 
exceptione le sau chiar aberante (erori grosiere de observaţii sau măsurători). 
An felul acesta: media n nu mai i reflectă: corect aui centrală « a. scai , 

statistice. ` NG E 
| Pe ge. altă pa dă -cimptimi? excésiv leida extremo, | 
- comparativ cu. ele aflate mai spre centrul repartifiei. La distribuțiile simetrice 
- faptul acesta cou tează mai ¿pupas î însă ha cele c cu asimetrie pa piere, A 
„se schimbă. A iati e ads a aea be 


d Mannu, s Tre p cu » cla arid d şirul de precipitații a anuale n. 
mm) ingegistrala pe 10 ani consecutiv etalează următoarele velo: 
| „.0; 10; 05.0; 100; 20; 250; 0; 0; 20. 


É „Valorile or ordonate rapa pentru. 'determinarea modului şi a mediei 


E “0; 0; 0;:0; 0; 10; 20; 20; "100; 250, 
| “Valorile contrilo sunt: Mo= o mm; Me = 5 mm; X = 40 mm, wo 
* Este clar ca mediana, | si chiar modul, reflectă mai corect: condiţiile 


si ivii din deşert; faţă de acestea media este „trasă” în sus de către k 


„cele două valori foarte mari. „Rezultă de aici si: dezavantajul de a folosi o 
area ji valoare centrală pentru e caracterizarea 1 unei orb a | 


a 2. Parametri a pere 


7 


Dacă datado sunt pe grafos cea. mai alt si eficientă 


p Aer asupra împrăştierii valorilor in cadrul intervalului. total: de variaţie: 


-O oferă curba de distribuţie a frecvenţelor. Pentru exprimarea numerică Adi 
acestei i împrăştieri se folosesc parametrii dispersiei. zii i 
! La determinarea acestor aaa, se Pa lua în considerare valorile £ 


dy extreme, mediana sau media A | 


H 2. L Amplitudinea de variație o 


A Reprezint diferența d dintre valoarile maximă si i minimă ale ira i 


"E Ar Dezavantajul prici care ce ca acest A olla: sá he. le că 
- inutilizabil pentru : caracterizarea dispersiei, este că amplitudinea nu poate - 
preciza gradul de dispersie a valorilor faţă de o valoare centrală/ Ea exprimă. 
“doar ordinul de mărime a intervalului de variaţie a caracteristici, i 
RE, presupunând că î în interiorul acestuia valorile ar fi repartizate uniform (ceea 
„ce, de regulă, nu este adevărat). Se. utilizează, totuşi, atunci! când valorile. 
“extreme au. o semnificaţie deosebită pentru. fenomenul studiat — de ex. 
amplitudinea termică absolută, în caracterizarea gradului de continentalism | 
climatic « al unei regiuni; | | | 


„al 2, 2. Cuartilele şi abaterile cuartile. os du S E e 
Dacă Vilara centrală folosită di mediana, atunci dispersia poate 


=f Sl sub forma abaterilor cuartile. - -. eri 
| de Cuartilele A pte in > onografiore aimologi) s sunt t parametri i 


> 


d pe odio, dit e care y şirul de i în 14 părți e PURA | 


„a 


A incluzând 25% din valorile siruluj?. 7. De-a lungul unui şir ordonat crescător . 
vom identifica, deci, un număr de 3 3 cuartile, notate de regulă CU. Qiy Q: (= 
Mel si Qs. Cu ajutorul acestora se pot calcula doi indici e dispersiei: i 


26 abaterea cuartilá fintercuariilă),. care reprezintă diferenţa, în í 


a dá absolută, dintre prima şi a treia cuartilá ( Q, - 0) Y Se obtine o.. 
imagine sa dispersiei comparând a abaterea interouartilă cu eine i 
00% Cl pe zii i E EE Va ri 


éi abaterea semiintereuartilă (E, care se o defineşte ca i 


dee 


o cobai: a abaterile de la arii / — altfel s spus, jumătate. din 


- modalităţile caracteristicii diferă de medianá prin mai ul decât această, i 


i valoare, i iar cealaltă jumătate prin mai puţin. - 


“Având, ca şi mediana, avantajul că de ete! n at ep de ate : 


54 extreme ale sirului, abaterile cuartile păstrează si dezavantajul acesteia:.nu iau 
a AI considerare toate valorile, deci nu Vis seta ibi distribuţie st Maica. i 


2. 2.3. Indici de dispersie « care au ula bază media aritmetică 


Ama când Nalon, cenili Toată în. i cae ata cit di d 


p dispersia ı unei distribuții poate fi exprim..tá cu ajutorul mai multor indici. . 


e Jabaterea (absolută). medie (e). reprezintă media: aritmetică ai 


„ abaterilor v valorilor gar gi e valoare a gi de la media : acestuia: e rele | 


Ep 


$ La distribuțiile cu Ei de: frecvențe abaterile centrelor de clasă dee 
ta ¿Emp cu a aferente: T Cu bela e xi zi 


1 atunci i când se dicas o analiză mai detaliată a modului « cum sunt soia scie în A 


; ` interiorul intervalului total de variație, şirul poate fi împărțit în mai mult de 4 părti egale. 
` Valorile care delimitează acese subşiruri sunt cunoscute sub denumirea genericá-de cuantile. 
„Exemple de cuantile: mediană, cuartile, cant e tai en pei în 10 a arai iom Y 
$ 7 aia în AS de i, miza etc. i md E A — PL TRACO 


tenir >. pia 
JE e E Dim ta: SL 
a MA 
fa 
b: E. 
' 
e 


| Întrucât ] lucrează cu i saitul) abeólute, ignorând semnul 1 acestora, utilizarea 


4 e, ín calcule ulterioare este restrânsă; 


P dispersia sati varianța (02) reprezintă media a aritmetică a a pătratelor | 
d abaterilor valorilor din şir, es e media. acestuia: ME | Abia 


Ma o să „hei: cp 
s Ds l E PE, Dr] e am de del sa de d | a ap. + a | i ji 
dn a Pentru e disgio de emca formula se > modifica în i mod d corespunzätor: 


A Deci jespidai secando baterii este rézolvátá n din id de vedere: 
matematic) prin ridicarea acestora la pătrat. În schimb, semnificaţia concretă 

a indicelui este alterată de faptul că unitatea de măsură a mărimii pe care o. 
exprimă (de ex. °C, loc/km? etc.) este si ea ridicatá la pătrat. O cale simplă 

de înlăturare a acestui neajuns o constituie extragerea rădăcinii Tema dia. 
Variantá, obtinándu-se cel de-al treilea parametru şi anume ` | He 
| k md > abaterea standard (sau deviaţie standard, abatere medie piia.: 
Má a (o) PEAN pci, rădăcina pea a varanja s unei ci distribuții: au 


E A în ia a, a e vant atu NAC) 
„Iar pentru distribuțiile de frecvente: © / 


a 


AS prezentaţi y până a aici Sia dati, dispersia în Da absolute, 
adică î în valori cărora li se poate: ataşa o unitate de măsură (°C, m/s, mm, 
ha, loc/km? etc). Aceasta înseamnă că ordinul lor de mărime depinde. de 
| ordinul de mărime al valorilor distribuţiei analizate, în speţă de ordinui de 


mărime al Me sau X: Acest lucru constituie un impedime ent atunci când dorim 
Bă comparám între ele mai multe distribuții sub aspectul dispersiei. cama 
se. rezolvă exprimând dispersia în procente dia, Valoarea centrală pe baza 
căreia a fost estimată, rezultând aşa-numiţii indic? de variabilitate. relativ dE. | 
Aceşti indici sunt foarte utili în. geografie, mai ales în studierea variabilităţii 
„Spațiale şi/sau *=mporale a unui fenomen... | 
ff Pornind de la parametrii de dispersie prezentați anterior se pot 
„calcula trei astfel de indici: 7 | 
„a abaterea cuartilă (intercuartilă) telarik; care reprezintă raportul 
„procentual dintre abaterea intercuartilă şi mediană: pi al un 


yo ' 
| a: variabiliidicas relati vă — raportul procentual dintre abaterea A 
| absolută medie ŞI. media aritmetică: co e A o 


| y e “coeficientul. “de variaţie. (notat de 'regulá € cu em, ca a raport 
| isa dintre è abaterea standard şi medie: | E 


CV => x100.. A 


Cei i galos i au ocio dear iulie ce -intră în ao 
lc Prin urmare coeficientul de variaţie este, potenţial, cel mai potrivit : 
Sl PA 2 fi utilizat î în prelucrări Mari Oare: Să 


Atunci când: se e ai un set de date s se > pune f pibid di 
vé parametrilor statistici care. să corespundă cel mai bine scopurilor analizei 
„. „Statistice. Fără a exista nişte reguli precise, alegerea parametrilor a? Paiculat 
trebuie să ţină cont de. următoarele aspecte: lil 25 EN 

— în general este bine sá se calculeze: toate cele trei: valori centrale: i 


C, Mo (dacă avem o distribuție de frecvenţe), Me ha x, întrucât cu SAjutotul lor 
poate fi evaluată asimetria distribuţiei: e Lei | AA 
fA A Y < Me < Mo — - asimetrie e di dia, sau ü negativa; | 
ii) Y, ES Me > Mo - — - asimetrie de stánga, sau pozitivă; ii 

: - Hi) X = Me~ Mo. — — distribuţie, Cvasi-simetrică. - pais 

a ie -scopul prelucrării er ca şi faptul dacă sezultatele bsmeazk, Ni 
| seu: nu, să fie preluate în calcule. ulterioare, * "Dacă se urmăreşte. doar i 
$ descri ierea si caracterizarea. sintetică a unor ansambluri de date pentru a | 
“ facilita înţelegerea. unor fenomene, atunci modul sau mediana, împreună cu 
; i; abaterea medie, abaterile cuartile ` ŞI, eventual, variabilitatea relativă Vor. fi 


| pa suficiente, având în vedere « şi faptul că aceşti indici sunt mai intuitivi (deci 
+.» mai uşor de pus în relaţie cu fenomenul descris). Pentru analize statistice mai 


-" complexe, însă, utilizarea mediei La a indicilor care au la bază media pura : 
„obligatorie; ds baba 

a ata - natura datelor. supuse Prokino. altfel spus. tipa: de 

| - caracteristica a cărei distribuţie statistică se vrea a fi analizată. Conteaza, 
„deci, dacă avem de-a face cu o carecteristică calitativă nominală sau ordinală, 
„na cantitativă discretă sau una cantitativă continuă, întrucât, aşa cum s-a 
z văzut anterior, posibilitatea T: modul de calculare a Parametrilor statistici | 
i diferă de la un tip la altul; - EERI Y, 

o nivelul de tăţelegere i a beneficiarului alados mia Este 

-clar că un 1 beneficiar fără cunoştinţe de statistică va prefera un material mai 

i bogat. în ilustraţii, fără „prea multe formule şi indici. fitre) ale. căror 

; „semnificaţii sunt mai greu de evaluat şi interpretat; Ai 

A ee a == > Přezența/absența aia agati întrucât, asa « cum s-a. väzu, ij 


„pentru înțelegerea noțiunilor de asimetrie stinga/dreapta, respectiv pozitivă negativă vezi 


$231... 


determinarea unora dintre indici presupune calcule laboricase. tai A 
| ME 


2.3, Parametril ini 


Aşa cum s-a idiot Jesdalk golami 4 se referă î în primul rând la 
forma poligoanelor (curbelor) frecvenţelor. Ut ilizatea lor în geografie este. 
oa putin frecventă, deoarece capacitatea lor descriptivă este mai redusă 
comparativ. cu alţi indici statistici. "Totuşi, parametrii de formă sunt foarte ` 
til atunci când se urmăreşte compararea unei distribuții empirice (alcătuită 0 
„pe baza unui eşantion) cu o distribuţie teoretică sar Pelada dp iai cu a 
-distribuia eşantionului. í ii Fen 


2, 3. L Incici de asimetrie 


$ e detii Cosficiengii) d de asimetrie exprimă nume! ic > măsura î în n care 
“maximul de frecvenţă +. Ata E 
„al unei distribuții este pr 
„deplasat, spre stânga |... 
„sau spre dreapta, faţă | 
- decentrul intervalului Pelos: 
(de variație. T | 
'caracteristicii) Din |... 
multitudinea indicilor E 
„de asimetrie oferiţi | As 
de literatura de | ~ 
pecera | | 
„aici doar doi, a căror. Sé intin ENT | PE. 
utilizare - „este Es $ lezeze ÎN — e oo ae E 
- frecventă. +: Figura 2,1, Asimetrie pozitivă (a) si negativă (b) a 
MOE “coeficien- | unei E estudie, a erica zi: 
tal Pearson. Ae ica. | a 
“calculează doar pentru distribuțiile de frecvențe, deoarece i ia în în considerare 
Fars | sii 


„Ra a` o ; : a: 3 3 o5 

i 3 “E z . r. 
ia 4 de e 3 A a 
9 dr 6 tdi E AS 


„În n funie de e raporturile de de mărime dintre x şi Mo coeficientul poate ño 


negativ, mul: sau pozitiv, ma siiibule fiind a asimelriei. oii get 
de ing iaca a Aa a pt aa Iau ca DAA TUNA 


k mic ca: a sau i de dins se (modul este mai mare ca pa ceea. ce E 
lînscamnă că maximul de frecvenţă este ep lasat spre: dreapta, m id centrul, 
intervalului de venion — vezi fig. 2, d); 


îi). TE = Mo. - ~= asimetrie nulă. Curba. de distribuţie e pent o peta 
simetrică, iar “cele trei valori centrale, coincid, fiind ho ad în so 
uși intervalului de variaţie; PN iuli ct, gi > sy 

Dă > Mo asimetrie e pozitivă! IE mă este potătiv ea sau dë. 
j stânga (modul este plasat, 1 in cadrul intervalului de variaţie, | la stânga maa de . 
„medie şi faţă de centrul intervalului - — vezi fig.2.1-a): ! e ad 

e coeficientul Fisher o- — da in n considerare o cawg abaterilor valorilor de 
` la media lor aritmetică: Aa Pa ia NE ua ma i 


` 
s, 


i ` par “q | 3 | = AAL el ¡MOS E 


penis siruri i de valori i individuo, iar pentru disc pes 5 clase ede o frena 


Pap 


DS. 


4 y * e 


a prg i 
si Aa indios. ite r bait, (EEE sau i mul, „interpretarea 3 asimetrici | 
„ Bcându-se w e ca în cazul coeficientului Pearson. o 


sd 3.2 2 Indici dee exces s (de aplicar) 


EN ii. e indici . care ER numeric di de iuti a cita de 

| distribuție, aplatizare ce “depinde de gradul de concentrare a valorilor 

-caracteristicii în apropierea maximului de frecvenţă; ajltialspus, de diferenta © 

"dintre frecvenţa clasei. modale şi cea a claselor din apropiere — cu cât, 

-diferenta este mai netă, cu atât curba va fi mai ascuțită şi invers. — ` 
“Cel. mai i des utilizat e este e coeficientul Y q lui Fisher: | 
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LI Fr 22 


iar pentru distribuțiile o cu 3 clase de frecvenţe Ll | 
a Ct - emca 
ct ial 


y Fim gS 


„Acest indice „poate. G pozitiv, is E pat şi interpretarea lui se face astfel | 


(vezi fig.2.2): 


ìi) y <0- 


curba este mai aplatizată - A 


“gradul de aplatizare a | 


a 


“curba prezintă | 
- ,exces” de boltire, de e 
este mai OS decât 
„cea normală şi se 
- numeşte leptokurticd. ~ 


decât una normală şi se - A îi 
dă e a ip aA normala . . | 


numeşte y platikurtică d A o ah h aa mm curba platikurtica . 
(grec. i kurtosis EAS E a | je A curta jeptokurti ca 
_boltire); E vi g i | 

ii ii) Yo =E 0 — 


curbei este identic cu cel- 
al curbei normale;) A 
la iii) Y > pag iie 


E 2.2. Modificarea formei unei curbe de 
taa gl a Aa giga în me i de excesul a 
acesteia. 
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M etodola de pasele numerică $ arici a distribuţitor statistice, UA s 


E până acum, au fost ilustrate cu: eee: 4 în care valorile concrete 


` erau date reale, aşa cum rezultă ele din operaţiunile de măsurare sau, mai 
iu: general, din observaţii ¿ asupra fenomenelor si „proceselor din lumea reală. Pi 


NEJN „ Aplicarea metodelor menţionate: direc ct asupra datelor de observaţii y p 
SL măsură tori. este: pe deplin posibilă atunci când. scopul analizei nu trece tei 


i - dincolc o de. descrierea unui fenomen. sau proces. cu ajutorul tabelelor, al. 


| diagramelor ş şi al parametrilor statistici. Situaţia se schimbă, însă, atunci când ` 


id ; derim sá ex! tindem analiza i) prin compararea mai multor distribuții -. 
statistice, sau (2) prin. „valorificarea unor modele teoretice utilizate în 


a Statistica infer enţială.. ii 
cn bagi ine cazul (1) cor parerea directă a r distributiilor statistice întâmpină 
E, trei tipuri de dificultăți: ; a 
A y valorile din şiruri « au arlig dé márime diferite - ~- de ex. di al 


i a medij ziinice ale unui râu se exprimă prin valori de ordinul zecilor (de m?/ s), i | 


în timp ce nive lurile oe au ordine de márime de ordinul satair i 
eN (de cm); aja e de 
PA valorile du şiruri, Wiar având soplaşi ordin de mărire, se e referi 
. la mărimi care au unități de măsură diferite; W 
© > © chiar dacă nu, apar dificultăţile de mai sus, este posibil. ca... 
ră dispersiile şirurilor, exprimate în valori absolute, să difere foarte mult, 
o, împiedicând. comparațiile directe. de e i 
aa Asemenea. dificultăți pot: ñ înlăturate 1 în 1 mare pare prin a operațiunea 
3 de Standardizare („normare”) a datelor. | 
E În cazul (2) distribuţia empirică de ¡nda poală. sá difere mult de | 
i zau distribuţia teoretică ce constituie modelul de referință ŞI: punctul de plecare i 
-> Pentru raționamente, Şi inferenţe statistice. „Diferenţa dintre distribuţia . | 
“empirică şi cea teoretică poate fi redusă A priit Lada de pes rod 
KA dalele din şirul, sups, pantei gal 


3. 1. Standardizarea (nonnarea) + 


lili aa eo > dorii de firmas a disioi iniţiale în aga 
[. [fel încât să devină posibile comparatiile intre. două sau mai multe distribuții | k 
"empirice, sau între o „distribuţie. empirică şi una te oretică, indiferent de S 

| > ordinul de mărime, , dispersie sau unităţi de măsură. E an UE 
E - Standardizarea combină două operaţiuni: centrarea şi -reducția. 3 
:.1° centrarea valorilor unui şir constă, în general. vorbind, in * 
f sait valorilor originale cu abaterile acestora de la valoarea de referință: 
„mediana, media, sau © valoare oarecare, considerată semnificativă pentru 
Seal analizei statistice. De remarcat, însă, că centrarea, ca primă etapă în. 
“cadrul standardizării, . presupune centrarea. valorilor în. raport cu media 
- aritmetică. Valorile centrate au o caracteristică ce derivă din proprietăţile 
-mediei aritmetice, anume aceea că suma lor este nulă, Dacă x este variabila 


ro 


+ analizată, dar e 1 „ste variabila centrată, „atunci X =s% -% j iar i 
E E ys = reducţia unei väriabile constă, în general vorbind, în împărțirea, 
[valorilor a acesteia la abaterea standarde A A PRN BERO 
| ANS qe A f = psa e sea | 
Ca oa doua a capa a  standardizärii, însă, radica se api variabilei :ă 
„centrate: a E Oy y A Bi At aa | 

Sa A AS 4d 

mai y ES 


fo pe Pi a a unei variabile reduse este aceea că abaterea sa 
(oz este egală cu unitatea; g, = = |. Eei a 
= Prin urmare o variabilă dia, (cenizată + stu) e este o j 
` variabilă a cărei medie este întotdeauna 0 şi a cărei abatere standard este 
întotdeauna 1.- Valorile standardizate exprimă abaterile valorilor variabilei “ 
originale de la media lor aritmeticá, abateri care sunt măsurate f în număr de 
o: standard. “În felul acesta dispar unitatea de măsură, „dispersia şi y 
E: ordinul de márime ale variabilei şi devine posibilă compararea directă cu 
` altă/alte variabile standardizate, întrucât ele vor avea aceeaşi medie (0), 
Ci capia dispersie ( 1) si te cutia numai căt mărimea abaterilor valorilor lor den 
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AN medie... 


19, 2. Transformarea. 


O parte di interpretările si concluziile referitoare iu o distribuţie 
empirică are la bază” pa 
prezumția că aceasta  p 
urmăreşte indeapraoape |. 
distribuția normală, în. | 
ceea ce priveşte alura | 
curbei de- distribuţie, | 
asimetria, excesul. Ori, |. 
în realitate, deseori | bl. 
această prezumție nu se | s| 
verifică şi din această hiat R 
cauză caracteristicile EE 
„distribuţiei normale. nu . | | | | 
` mai pot fi valorificate î în Figura &p L Normalizarea unei distribuții de 
| . relaţie - cu distribuțiile frecvenţe (tensiunea medie lunară a vaporilor de 
empirice, O soluţie la „apă la Bota last, ui lied 0 Vegas 
„îndemână în asemenea 
Cazuri este aceea de a e ETA de po în asa fel, încât 
distribuţia empirică să se apropie cât mai mult de cea normală. se 
procedează, deci, la o transformare matematicá a valorilor variabilelor, care 
are drept rezultat o. concordanţă mai bună între distribuţia empirică şi cea 
teoretică. Întrucât distribuţia teoretică vizată este, cel mai adesea, cea 
normală, transformarea, „datelor ¿PORO mai. pastă denumirea en 
“normalizare”. 
| Posibilităţile de taie men sunt multiple, însă doar câteva dintre i 
ele sunt mai des utilizate, întrucât şi-au demonstrat eficiența: transformarea 
- Prin logaritmarea valorilor variabilei, prin extragerea radicalului din acestea 
Si- prin ridicarea lor la putere. Experiența- dobândită în acest. domeniu 
Tecomandă transformările prin logaritmare si extragerea radicalului pentru 
- corectarea asimetriilor pozitive (vezi fig.3. 1), iar cele prin ridicare | la pama 
Pentru corectarea asimetriilor negative ale distributiilor empirice. $ 
„De cai aia că aia Aa rezultatelor unei analize făcute 


bra 46 8 10 12 14 163520 Z emm HO) 


supra unui sir de valori. transformate, w termenii reali « ai problemei în ; 
discuţie, ac cestos, c ca aşi i valorile, trebuie re-transformate în forma lor originală, 3 


` [] e 4 5 d 


` CIS 
` ES se 
i HNE, 
Mo Dh 
4 ` TE ` 
. Es 4 š 
. ' s 


iz Iy, FUNDAMENTUL E PROBABILIST AL 
IAS STATISTICE 
Al . Distribufia tuba) normală şi caracteristicile sale 


Hi Sa ilie! antérior. că bold din prior et dein daielor de F 
| observaţii sub formă de distribuții d e frecvenţe este acela de a face comparații | 


„. între distribuţia (şi curba aferentă) empirică si una teoretică, fixată ca model ` : 


de referinţă. Similitudinea de. formă á celor două tipuri de curbe (empirică ş şi 


teoretică) este: foarte importantă, căci ea oferă nişte posibilităţi de analiză . - 


statistică complexă şi aprofundată în urma căreia! se pot trage multe concluzii i 
de ordin ştiinţific. La Ain multor am de analize s se află tocmai curba, fe 
normală, cu paja A ata TEA pigi. 


“Dar ce este distribuția dorala? | 
. Toate. distribuțiile de e frecvențe. empurice, adică alătuite pomind de ca 


de cazuri. | 
frecvenţe se pot face mai uşor dacă se admite că respectivele distribuții au la 
„baza ‘o infinitate de valori, deci şi o infinitate de clase. Histogramei ` 
| frecventelor 1 îi corespunde î în acest caz un poligon al frecvenţelor i ce apare sub 
forma unei curbe „netezite” care poate fi uşor descrisă cu piony ecuațiilor 
„matematice. O asemenea curbă este şi cea normală. 
| La o histogramă a frecvenţelor aria unui dreptunghi este 
proporțională cu frecvenţa clasei corespunzătoare. Acest fapt este valabil şi 
-În cazul distribuţiei normale, a cărei curbă de distribuţie trece prin capătul 
Superior al unui număr foarte mare (a limită, infinit) de dreptunghiuri de 
- lăţime foarte mică (la limită, egală cu 0), având drept rezultat netezirea 
curbei.. În acelaşi timp, se admite că suprafaţa. totală a tuturor 
dreptunghiurilor este egală cu azi (Sau. 100%), ceea ce înseamnă că aria 
| beto ` între curba normală şi abscisă este deasemenea 1 (sau 100%). 
„Curba normală este o curbă ont raoba eee Scan 
K nferă = de il O lui far nul „Relaţia 


S 


la date reale, se bazează pe un număr finit (chiar dacă foarte mare, uneori). n 
matematică însă, unele generalizări cui privire la distribuțiile de ` 


în care: 


| alura curbei normale este `. 


în. relație cu o, atunci | y don Puso (dabas: 


o o ora Ira 


a: având X = = 0şig=1; 
„deci, „dacă „notăm 


E curbei normale standardizate (normato): 


„descrisă de. cei doi | 


“parametri - X si o. 


ATT 


y= reie (frecvenţa) ur unui. ip e oarecare da e curbă; P | 
x = abscisa. punctului respectiv, corespunzând | u: unei valori din, 
populaţia i infinită descrisă de curba normală; | 


Xx si g- parametri, 


Întrucât este perfect simetrică, în cazul curbei normale 3 ES = "Me = 


| “Mo. Dacă tinem cont că 


putem spune că- o 


“distribuţie (curbă) je 


normală este perfect 


Vom observa că |. 


N exponentul lui e seamănă |. 
¿EM formula de calcul - 
 pentru ` valorile unei : |” 
= vanabile standardizate - trsi 


Figura 41,0 T ca ba normală a) e curba normala | 
a o aa AEs. ES 1 


X-X. 


Ea =u obțnera ecuația > de ad dd a 


eS AE e 
7 e! > e ` 


A: AS 


"Bill uiajaăă a că cele două curbe Gorini ¿Apia? şi îi dia 


z standardizată) sunt identice ca formă (vezi fig. 4.1). Diferenţa dintre ele este 


| „dată de, valoarea centrală. dă respectiv 0) şi de unitatea - de. măsură a 
ui valabile pe axa es (la. cea a standardizată valorile i. sunt exprimate ca a abateri, 


Acad da Xx , másurate 1 in nuimár de di | dura te Sl 
i "“Ordonatele curbei normale (valorile y) eii Jrevinielor de , 
“apariţie a diferitelor valori; întrucât numărul. acestor valori este infinit, este - 


` justificată, matematic vorbind, trecerea de la i moțiune fe frecvență la c cea „de ` i, 


E ojala SE: di i feras: 


“0 proprio: foarte pa alai a pt st aie este Á aceea „că, s 


y indiferent de mărimsa mediei’ sia abaterii standard, există o proporție aa. | 


arie sub curbă) constantă cuprinsă între X E şi o “ordonată oarecare a cărei | 
distanţă faţă de X este măsurată î în număr de o (vei fig. 4.2). Atunci când 


această distanță este egală cu 1 €, spre dreapta faţă de X, aria de sub curbá | 
este de 34,13% din aria totală, iar dublul ei (68, 26%), reprezintă aria de sub i 
curbă de o parte şi alta a X, până la o distanţă de 16; altfel s spus, 68, 26% din có 


S valorile distribuției. diferă de X prin mai putin de la sau, ceea ce înseamnă $ 
acelaşi lucru, există o probabilitate de 68, 26% ca o valoare oarecare să fie 
i cuprinsă 1 în intervalul dintre -70 şi + lo o. În mod corespunzátor, probabilitatea | 


: cà o valoare oarecare să fie inclusă în intervalul dintre -20 şi +20 este de 


11195 la, lar. ni intervalul: neo: 30 a +30, AI eu este de ln. 


ta celor 36. “Dupa: cum se observă e probabilitatea x unei RN i 


care să difere de X cu mai mult de 30 este practic nulă (0,26%). Acest fapt 
« este foarte util în practica verifizării acurateţii datelor de observaţii: care 


în “constituie. valori ale unei. variabile Co urmează O distributie normală. Dacă, F 


de exemplu, într-un şir de 50 de valori apare una care diferă de medie cu mai 
mult de Jg, atunci valoarea respectivă trebuie privită cu neîncredere, chiar 
„dacă ea nu poate fi considerată a priori ca find eronată. Trebuie verificate zu 
fe “corectitudinea determinărilor/ măsurătorilor, sau cea a transcrierii datelor, sau 

„ omogenitatea datelor etc. Această „regulă a celor 30” constituie, deci, o cale ; 
de a ne feri de erori id atunci cánd analizám seturi de date angota; de 


O este e AGR cu ile spre < care tinde « o on, atunci i ina | 
| umarul | elementelor din. n populatia originari y tinde ee: infinit. + Rami = Dal 


deis sens strit “procentul 100% mu este niciodată atins, căci curba 
normală nu atinge niciodată axa Ox, ci se apropie asimptotic de aceasta. 
Să observăm că în figură ordonatele care delimitează suprafețele de 


sub curbă corespund 


unor multipli întregi 
(1,2,3) de o. O imagine | 
“mult mai completă se | 
“obţine. atunci când 
“suprafeţele de sub curbă | 
vor fi precizate “pentru | 
un număr mai mare de || 
ordonate, cărora le vor ` | 
corespunde valori. | 
intermediare no (n — | 
număr real). - Aceste |. 
suprafeţe procentuale | A 
(sau probabiliăţi), ca şi 
“cele corespunzând. 
„probabilităților apari 
ascendent, au. fost | 
-calculate şi sunt trecute în tabele TN laig utilizate î în sp prolucrárilor 
statistice (vezi Anexele 1 si Ds | | 
Cu ajutorul unor asemenea tabele pot fi SENEM patru e de 
| probleme (fireşte, în Riva cá distribuţia de io urmează o lege normală 

| de repartiție): | 
A aoleu probabilității cazurilor mai mici ca o anumită 
valoare dată, numită: valoare critică („probabilitate de nedepăşire” sau 
„asigurare de. nedepăşire”), respectiv mai mari sau egale ca dirias 
| e Auca cb tc de Etc] él mai i 


Figura 4 2, Repara suprafejdlor ma curba 
| normală. . 


Exemplu. Pentru şirul de temperaturi medii. site la staţia laşi, 


| perioada 1961-1992, s-au calculat X = 9,42*C sio =Ù, 82°C. În ipoteza că 
| dis:ribuţia variabilei este una normală, sá. se- determine probabilitățile- 
: procentuale de apariție a unor valori de temperatură mai mici de 10°C, 
„respectiv mai mari de 10*C.; sau, folosind simbolurile matematice uzuale în 
_ statistica matematică, sá se determine P(x < 10°C), respectiv P(x > 100). 
| Pentru a putea utiliza tabelul din Anexa I trebuie mai intái sá standardizám 


s 


a 0,58 


| valoare rea , critică respectivă: us se, [TA = 0, me Intrând, în 


a. 0,82. 


| tabel c cu dijo u calculată găsim o probabilitate. de apii de o, 7611 
—sau 76, 11%. Probabilitatea. de depăşire este una complementară față de cea. 
“anterioară, deoarece suma lor trebuie să acopere întreaga suprafaţă de sub 
curba normală; deci ea se. obţine scăzând din 1 (sau 100%) probabilitatea de. 
„nedepăşire: 100 = 12, 11 = 2%, 89%. Dacá valoarea. critică x, este mai mică | 


decât media X, atunci u< <0, iar probabilitatea de nedepăşire va fi cea | | 
- complementará celei citite în Anexa I T taie a de simetrie a e 


i curbei normale); 


5 „ze determinarea. probabilității paiia Dia între două timite 
| (valori critice) date. Această probabilitate este egală eu suprafaţa de sub curba 
i, normală delimitată de cele două valori. Cu ajutorul tabelului această suprafaţă 

se obține ca diferenţă între probabilitățile nep ce maticonsd galos dauk SEN 


valori. : 


ai anuală cuprinsă între 9 şi 10°C, sri Prag simbolurile u uzuale: de 
x.<: EA E 


Probabilitățile cumulate c ce pd in di paun critice le extragem din i 


„ Anexa], Saar ce am poe în prealabil, la standardizarea lor: 
| pi ie DA Ta = 0, 115 în Anexa I găsim Epit 0, 7611 = 
| 16, 1%. a3 


= (9-9, 42)/0, 82 = be 51 1; deoarece u,<0, probabilitatea căutată: A 
h este cea A re + probabilității pe care o găsim în Anexa Į intrând cu 
"valoarea absolută a Tui u; P, = 1-0, 6950 = 0,3050 = 30,5%. 


POCIE las OR 76,11-30,5 = 45, 61%. 


3° Detia voldte căreia îi i corespunde O probabilitate dată (de | 


| pasi sau de nedepăşire). - 


A În exemplu nostru, cărei temperaturi pe anuale 1 îi corespunde a: 
| probabilitate de 80% de a nu fi depăşită? Sau, într-o altă formulare, care este . 
; valoarea. faţă de care 80% din valorile io d de uiti ăi sunt mai Pt, Pe 


„sau cel mult egale cu aceasta? 


2. -ă caută î în ra: 1 ST probabilitatea ea cea mai i apropiată de o, 80, apoi pr 


pat 


Sá presupunem, cod. cu pe din eetri de mai i sus, că se 
A „cere probabilitate ca în unul din ani să se înregistreze o temperatură medie 


í se € ex virago valoarea u corespunzătoare e (0,80); 
CAN die a E de YA spo 
eais din formala usii se scoate 


= uo + F = 0;84x0,82 + 942 = 101%. 


ae mărimea intervalului (implicit, limitele ini expr. ha. 


număr de ç de la Esa care include un proc cent dinainte stubilit de valori. ` 


| În exemplul nostru, care este intervalul ce include 95 % din valorile 
y de temperatură? Altfel spus, care este intervalul î în interiorul căruia ed 


95% şanse de a fi inclusă o valoare, oarecare din gin? 


: Întrucât acuza nu mai avem “de-a face cu.o probabilitate de depasire. sau 
„ medepăşire, ci cu probabilitatea ca o valoare să fie situată în interiorul unui. 


` interval centrat pe media aritmetică, vom folosi Anexa TI: 


„se caută în tabel probabilitatea care reprezintă jumătate din 95%, 
aceasta deoarece 1 in tabel sunt considerate abaterile faţă de medie doar într-o 
| singurá direcţie (ori, intervalul nostru se extinde de ambele e părți ale paie) 


- se scoate valoarea £ corespunzătoare (1 96); | 


qq - intervalul nostru va fi X i l; 960 dat, Pa repartiția n normal | 


Mojo 0=1) adică a, 4...11 40. 


LL 


ridu De notat în distribraia normală este doar una (chiar d dapt cea mai 
cunoscută şi uzitată) dintre distribuțiile teoretice ale căror proprietăți pofi 


valorificate în analizele statistice. “Menţionăm alte câteva ena teoretice 
- care pot fi utilizate cu succes în analiza datelor geografice: „i 


a) distribufia log-normală, sau a lui Galton — este o variant a a legii . 
- normale, în sensul.că dacă X este o variabilă ale cărei valori x; urmează o. 


~ distribuție log-normalá, atunci valorile log) urmează O distribuţie normală. 


Curba log-norimalá prezintă O asimetrie caracteristică de stânga, 

destul de accentuată (vezi fig.4.3). Distribuţia log-normală este potrivită, de 
"exemplu, pentru aproximarea distribuţiei de frecvenţe a precipitațiilor zilnice. 
(variabilitate accentuată şi multe valori mici, sau chiar nule, corespunzătoare. 
„zilelor fără precjpitații, < care atras” maximul de dh te adică FMO; e 


| stânga); 


: b) biia binomială — “este una PN ‘distribuțiile TOA 
fundamentale i în statistica a inferențială, alături de | cea normală. ala deosebire. 


: de- distribuţia. normală, cea 


“binomială se aplică, piak Bis e i en $ 


variabilelor discrete. Ea | 
j; „ aproximează distribuţia statistică | 
“4 unei variabile (discrete) ale. 
cărei valori se grupează, în 


“funcţie de un criteriu, sau o 


„Valoare. critică ‘dată, în două i 


"categorii - care. se. osul 


reciproc, iar suma | 


probabilităților ce. „corespund 


„celor două categorii este egală 
“cu probabilitatea totală (1 sau 


100%). Spre exemplu, un şir ii 


mame 7 3. | Gura aria | log- j 
„normale. i 


aruncări ale unei monede: PETRE i ev eniment individual (aruncare) poată să h 

„ aparţină la 1 din 2 categorii: capul sau pajura, : niciodatá şi una şi alta, iar 

- suma frecvenţelor (probabilităților, î în cazul unui număr infinit de raclă i 
„dă numărul total de evenimente a RENE 1. sau. 100 T 


Poisson EA O distribu í 


"căreia i “se. supun EA 
variabilele cantitative (fot ŞI Re SAD cca a dC ENA ia, 


e) ale căror pm E al} 
„au - frecvența | 


iati foarte mică ba EAT A O 


-timp sau spațiu), motiv- O E 
„Pentru care mai este || Sf 
„numită şi. „distribuţia a E 


4 pusti pi a] oxin are C PME- 
i XE distri utia normala 


- evenimentelor AZ 
- Exemple de astfel ` de p T aie ; 
variabile: .. “număr de i că o 


. viituri în sezonul cald; 


| re A rE Turba dismribujiei Poisson iul 


„număr de zile cu îngheț ETHE, Valeri ale mediei A E 


„ timpuriu/târziu (dintr-o. 


a. 


PET roadă. caer pn: ; A poa 0) 


e 


| Oare teristica dia aaă. Patan O constituie, ap Meu a doi 

| parametri de bază: media aritmetică şi abaterea standard. Curba de distribuţie 
„este. de regulă asimetrică, dar asimetria scade odată cu creşterea frecvenţei 
be de proque a acelor evenimente ı rare” ” Gig. 4.4). AS g | 


a “De remarcat, în “final, că pai eS normală, mâne una 
4 de vreme ce ea aproximează « destul de bine alte distribuții 
„teoretice (ca cea binomială. sau Poisson) în condiţiile în care numărul de 
„valori ale. variabilei studiate este suficient de mare, sau frecvența de 
à producere : a unor evenimente: tu suficient de mult, 


4 2 Caracteristicile esantioanelor Gondajelor) 


po ma at agita peneralizările (inferenfele. inductive). statistice au 
NN drept scop evidenţierea“ unor caracteristici ale fenomenelor şi proceselor care 
sunt studiate prin intermediul unor ansambluri de date de observaţii. Aceste 
- ansambluri ¿è mari. dimensiuni (eventual infinite ca număr. de elemente) 
„poartă deuumirea de populaţii. Însă din diferite motive” (de ex. nu sunt 
disponibile date asupra tuturor elementelor; pentru economie de timp; 
„numărul de elemente este infinit etc.), cel mai adesea caracteristicile 
$ populației pot fi studiate doar cu ajutorul unor subseturi de elemente 
(eşantioane) prelevate după anumite reguli din „populaţia respectivă. Drept 
“urmare trebuie să facem o dis stincfie clară între parametrii statistici. ai 
| populaţiei, numiţi Şi „parametri adevăraţi” , ŞI parametrii. corespunzători 
| Po pe baza i id pumn C iia ai de RE de o: 


4 2. y Relațiile dintre parametrii de sondaj si. cei ai i populații 
“originare. E 


a Este der cá E javia. (de « ex. ¡dcha AN Data! 
0) pot fi cunoscuţi cel mai adesea doar prin intermediul celor de sondaj, care, | 
în acest caz, reprezintă o estimare a parametrilor populaţiei. Precizârea 
» tipului de parametru la care .ne moien: se face cu ajutorul. unor simboluri 
d heng pri TEIN Ea ES MO 3 
| a = adevărata sd (a Japala. a TEN 
nG : = = adevărata oaia standard (a mu: A 


„XX = media conil (de sondaj); - 
`- s = deviația standard de sondaj - ER 
do: - Este necesar Ca. înainte de a cs A la o: Ae ale a y AREA 
PE tre diferite seturi de date (eşantioane), sau la formularea unor concluzii 

i) bazate pe parametrii de iai. să Ene câte ceva po ppal dintre cele 
G Apă pd de i sua a CR al Op cual 


5 “ Parajietrii care arial O populaţia e sui q Valori PI 
in (stabile) şi sunt de regulă, necunoscuţi. „Spre exemplu, vârsta medie a. 
„populaţiei studenţilor de la Universitatea laşi 1 în anul şcolar 1994/95 este un 
- “ parametru « cu o valoare anume, stabilă în. intervalul temporal de definiţie XI: 


„= populației; această valoare poate fi cunoscută printr-un efort de inventariere 


- a tuturor studenţilor, dar ea poate. fi şi estimată « cu hoi unor erep E 

extrase din populaţia respectivă, de | EN 
el “Prin comparaţie cu parametrii populaţiei, cei ide iliaj variază de la o 
Un esantion. la altul extrasé din una si aceeasi populaţie. În exemplul de mai . 


` “Sus, este de aşteptat ca pentru. 10 eşantioane aleatoare prelevate din populaţia 


| -de studenţi sá 'obfinem 10 várste medii. diferite, chiar dacă foarte apropiate 


„„ între ele. Parametrii de sondaj sunt: mărimi cun. „sute (sau calculabile) Boo 


„acest fapt, combinat cu dificultatea — “chiar imposibilitatea, uneori —.. 
cunoaşterii parametrilor adevăraţi (ai populaţiei), evidenţiază importanța ei 
E cunoaşterii legăturii dintre cele două tipuri de parametri. Altfel spus, este 
“important să ştim. cât de reprezentativ este un eşantion pentru populaţia din . 
„Care este extras, sau cu ce grad de precizie reuşeşte un e mpa de sondaj zh 
| a aproximeze (estimeze) corespondentul său „adevărat”. = +E 
+ Din punctul de vedere al statisticii inductive, un eşantion reprezintă | 
9 secţiune, reală şi reprezentativă — atât cât permite: mărimea sa — prin 


iris populaţia studiată. Ideal ar fi ca prelevarea elementelor pentru constituirea . 
ti €şantionului să fie pur aleatoare pentru. a asigura. reprezentativitatea — şi. 


„există metode şi reguli care asigură această cerinţă fundamentală (vezi Anexa 
IX). În multe cazuri, totuşi, inclusiv î în analizele geografice, selecţia aleatoare | 

„ste fie imposibilă, fie neconvenabilá din diverse motive; dar şi în aceste 

„Cazuri există reguli de selecţie « care să asigure repreze .'ativitatea eşantionului 

„faţă de populaţia originară. Întrucât, însă, conceptele generale ale statisticii 

inductive. pot fi cel mai bine” explicate în termenii sondajulni aleator, în 

„Continuare. vom adopta. această Led netă abordarea al ba | 
| Prezentat) | 


“ stiind a A ua idas este aleston, fotonii major. care Controleazá i 
en dintre parametrii populației. şi ca al eşaationului este mărimea 
ie eşăutionelui. Pentru a intui cum acţionează acest factor, să revenim à puţin la i 

y aa a Lamani b 
ooo = Aspectul curbei ` _este determinat de teii fiecărei tori 
“individuale, ca şi de g, x fiind plasată central, Să presupunem acum că. 

„ xaloriie individuale au fost grupate in eppbospe alsatore pe câte ¿9 imi, 
` iar pentru fiecare eşantion s-a calculat X. 


pa. de as a mediilor esanticanelor va ñ deasemenea d 


una normală, . având 
“aceeaşi medie ca m 
distribuția iniţială, dar a | 
. mai mică, de aici 
rezultând forma diferită | 
a curbei (vezi fig.4.5, n | 
firesc, căci. selecţia “| 
aleatoare a itemurilor. |.| 
„pentru. fiecare eşantion | | 
face „puţin. probabilă A | 
extragerea unor valori | 
“situate,toate, de o - 
„singură parte a mediei 
generale, iar „prin 
medierea. celor 10 / 
- itemuri amplitudinea de Sara A | 
variaţie. (deci şi deviația dad a ciar din: 10 ; Sate va fi mai 
scăzută ca amplitudinea de variaţie (respectiv deviația standard) a valorilor 
` individuale iniţiale. În plus, se poate intui uşor că o creştere în continuare a 
numărului de itemuri din eşantioane va cauza o scădere. proporțională . a 
| deviatiei standard a distributiei mediilor de sondaj respective (vezi fig.4.5, n 
= 20), curba de distributie devenind din ce în ce mai ascuţită, iar mediile | 
mai strâns. grupate în jurul mediei „generale. Concluzia: varianta (deci Şi 
X qeviana standard) distributiei mediuor de Bondal, este î în relaţie cu numărul de 


Galei îndivitale) se 


Figura 4.5, Curbele distribuţiilor de frecvenţe | 
| cainii nd EEN y a o 


60. 


temoni, din  egaation, i iar această a roo» se. o poate s scrie o astfel: A ji 


| “în e care să 3. o; = varianja, repectiv, abaterea standard i = mediilor 
ȘI esantioanelor de câte n itemuri;. e “gi = varianta, respectiv abaterea d 
standard ale bei o normale fe valori Ami ua, LA y sa 
> esantioanelor. A e A A 
da „Această dit: éste > forte ibon pis E ld user le 
sa obținute prin prelucrarea datelor de sondaj. Astfel, dacă mediile eşantioanelor, 


de alcătuiesc o. distribuţie normală, atunci, date. fiind proprietăţile curbei 


| i normale, există o probabilitate foarte scăzută ( =0,3%) ca media oricărui Eh 


il hii să difere de media generală („adevăratâ”, h aia că s-au “luat, nb 


= “caleul toate iteniurilä individuale) « cu mai mult de 30, „adică (ohn); n); sau, | 
„este puţin pregati (probabilitătea = 5%) ca respectiva medie să difere de 


k hei generală cu mai mult de 2(0/ fa). n). Dacă aşa stau alle, atunci si ii 


reciproca. este adevărată, adică: dacă este cunoscută media unui eşantion, - 


> Atunci, este, foarte puţin probabil (probabilitate € 0,3%) ca media generală i 
(sadevärată”) să difere de media de sondaj cu mai mult de ohm), ), san i 


y „este; puţin probabil (probabilitatea = 5 %) să lies i cu mai aie de 2(0/ Jm). de di 

TE Cu alte cuvinte, dacă se obține media unui eşantion, este posibil să e 
se precizeze limitele între care se va situa, cu o anumită bes media . 

| jo adevărată dd eco! din care ovine, esantionul). Adică: iu ia 
„e Gia GPL o cuo probabilitate d de 68, 26%; ama 


e 


SIRE Polar respectivă, ca be normalitatea disipa x mediilor « de e sondaj, s sunt To 
„demonstrabile. A A MID Rea DE dea a Sar în păi 5 


` i Y EE G y OO A We 45 A 
E Ep IS ` E și 
d o . 
din EA AD 
. 


> 
ipe, i h 
-AR CR d 
. a . ATUA á E A y ad pase YS N SETEK E hi SA 
DA aaa e de r° - > A Ara REO A o. A yo i eo 
si Sir F. á dip ni pri ni ¿ pe n... 4 nds sd E a d a, ai» A Ni 


„ne E -u ps E +u, Ai ou oprobabilisto oarecscepy, dl 
r PY. 
E a cu, p% Pa fi extras din Anexele Is sau uD. 


să altei a ted i a se ap ERE värsta: AESA a. Pl «e studentilod] 
de la Universitatea laşi, în. anul şcolar 1994/95, „s-a alcătuit un eşantion . 
> (aleator) de 50 valori (vârste). Pentru acest eşantion, S-au 'calculat X= =23 ani 


„Şi s=2, 5 ani. Limitele intervalelor în interiorul AQ: cu probabilitățile d de, 
mai sus, se va Va E várstá medie v vor fi i; | 


KN găini 
SM =68 26%); A 


„di AL. 


n neq3-25 mia = eso, 35, 2 230 029) *. as 65+ 3, cal 


TP 


pE (23 ai e 25, 2 .2» que ao 70, ,23 +0 0) voza 30-23, ză 


pa 1,1 


(P=9s, 45%); | 


A pE. iw 2393. 2 me nasi 1,05, 2341 1091 95+ -2⁄4 2409) 


NT ui 


o (P= :99, 14%). 


gg va SEAN că lbrorvaml | în care se o află, u por cu atât mai niste cu E 


i cât probabilitatea este mai mare; deci sporul de certitudine se obie cu cu pri] 


A Tărgirii intervalului 1 în care se află parametrul adevărat căutat, 


| „Mărimea care controlează limitele intervalului, adică siy A, ei 
ai cunoscută sub denumirea de eroarea Aa: a mediei de Sonda. notată 


ES. 


„O eroare standard analoagă se poate. chin s şi pentra n deviația standard del 


| sondaj: 


ES, =——, iar ¿Els regu osti pt 
= 


3 2% ay 


or A d 
e ups fiind abaterea s de la d, exprimată i în număr de s del Corespunzin unei | 


A 62. í 


Y po date. 
| 4 2. 2. -Esantcnae m mici y 


aiji exemplu e cu 1 vârsta tol a a studenţilor, pitri calculul ES a Mist 


matii ia calcul nu G, ci 5, ceea ce înseamnă, că am asimilat pe Ei cu O, ‘Jucu £ 


„ce nu se poate justifica din punct de vedere matematic, La fel am făcut şi în 
cazul ES, Corect ar fi fost să folosim g, însă aceasta nu era cunoscută. Íntr- 
„adevăr, în practică se întâmplă deseori. sá nu avem la îndemână decât valori 

„de sondaj. Totuşi, pentru a putea aplica formulele de obţinere a erorilor” | 
“standard cu o oarecare justificare, se poate face aşa-numita estimare ag. | 
-Această operațiune, numită î în statistică „a obţine cea mai bună estimafic”, se: 

D amd prin aplicarea unei. piară e Valoarea S. Această corectie, Ta: 


| cunoscută sub denumirea „coreția lui Bessel” « este de fonna caca ` 


a transformă Sîn „cea mai bună estimiifió â y” Jotak i cu o. Aba aa 
-„corecţia, Bessel este introdusă î în formula de calcul a deviaţiei . standard dă 
A aud direct cea mai bună ness a o: îi ia include de 


re 


4 i go area dinte 5 si ô este fală Sic 0, 02), și şi “Ata AR Ra 
p. volumul. eşantionului (50) este destul de mare. Într-adevăr, dacă examinám 
formula corecţiei, lui Bessel intuim că, cu cât seganticonl este mai mare cu 


| „atât Valoara" Jn! ao se apropie de 1; pe măsură, “însă ce n “scade, 
„ Valoarea corectiei devine considerabil mai mare ca 1, afectând mărimea ES. | 
în Este clar, deci, că în. cazul eşantioanelor m mici (n<30, de ii init este e 


„corect să se lucreze cu LA şi n mucus. ” A 


La egantioanele 1 mici, însă, mai i apare o o problemit. 1 Datorită pici $ i 


| corecjiei, distribuţia mediilor mai multor eşantioane, chiar dacă păstrează 
- aceeaşi medie p cu şi populaţia originară, va avea o deviaţie standard o ce nu 
mai conferă distribuţiei caracteristicile unei curbe normale. Aceasta înseamnă 
că valorile de probabilitate şi, în general, proprietăţile curbei normale nu mai- 
“pot fi aplicate la un eşantion mic, chiar dacă populaţia din care provine acesta E 
urmează o distribuţie normală. În locul ei se foloseşte o altă distribuţie 
„teoretică numită distribuția „?” a. lui. Student. “Curba. de distribuţie ,f” este 


ceva mai aplatizată decât cea normală şi mai efilată la capete (fig.4.6). 
“în orice caz, trebuie reţinut că e! distribuţiei » ¿” se folose se E 


me în cazul „eşantioanelor 


mici care provin din 

E populaţii normale. 

A “Valorile aul ce Biaciu, 
E OA pentru diferite- |- TR Pepe 
„volume ale esantioanelor |. |... ' 
(1-30) şi diferite eat: Ai PA SA e 
-de probabilitate sunt |. |... 
' tabelate (vezi Anexa 1D. ENE 

si pot fi folosite pentru | |. 0.24 ps 

= rezolvarea. . diferitelor |- Las nL 

-probleme specifice. ci 
Da În cazui 

i intervalului în care este. 

„situată pu, “valorile + 

E înlocuiesc ‘valorile u 


ami dnd AEE A 


—— curbă sormala 
ORRE: Curba 't'. 


„curba distribuie . to. 


m deci REG F „Xa, AESi: cu o > probo Pa ss 


“dinainte. E Quen ds ipta 


Exemplu Da s: o. 1968). Sg. iod un: ei + A 
numărului de locuitori dintr-o serie de localități mici (comune) - de pe un 
teritoriu vast. Numărul tota! de localităţi este mare, însă anumite similarități 
„în ce priveşte numărul lor de locuitori sunt sugerate de cunoştinţele existente 

asupra regiunii. De aceea s-a hotărât să se facă o analiză preliminară rapidă, 
„pe. baza unui pios aleator mă numai 10 N pirate ne astfel încât „numai Ba 


aS : 


Tigma 4, 6 AIE între curba normală si | 


pes a E = RH a A 


caracteristicile demografice majore să fie a i: pula Seat: stage Et 
s-au calculat următorii parametri: A ER e 


X =350 loc/com; s=25 loc; n= 10. ei | 
| Care sunt limitele intervalului în care se > afik media adevărată. a 
| numărului, loc/comunk, cu o psobabilitate de 95 aiy iig 


A i folosind. proprieti curbei rormale ca si cum am avea Eai 
eşantion mare) şi. tuând 207,39 =R E add 


EE 1350-2 Tras „3504 204 D 


bt ot cu opuso curbei normale, dac fată « cont de corset Y 


O ceea mmm dare voi 
Bessel $ = $ [a al a, iT = 26,34, de i oz 


i alhat | Pd 
EEL E 


| | E. A E 
633, g- 236,6) A da 


AO) ținând coat ca: Tuc Aa w ua “eşantion mic, deci ji) 
proprietățile distribuţiei „2” (vezi Anexa. 1; intrarea în tabel se face. cu 
probabilitatea dată şi cu numărul = de libertati, „câre aici este egal cui 
Al], adică 9): ate A | 
EE fosa nd a LA e 65023: 85, 350+2,3+ 3 D 
= d Na Ia 
4 (330,92 369 X fa PA | 
“Examinând cele trei rezultate constatăm. că prin “ considerarea | 
regulilor statistico-matematice de prelucrare, mărimea intervalului a crescut 
sensibil, ceea ce înseamnă că pentru eşantioanele mici se iau O serie de 
„Precauţii suplimentare atunci când se estimează valoarea. unui parametru 
“seturi posó care rió în ultimă instanta, P lărgirea intervalului 


| pentr semnificația noțiunii „arde pi libertate" vezi T 43212 st 


$ 65 : 


de încredere. | 


4 2.3, Specitcarea mărimii egantionuhui prisin at l 
opla die cele spuse referitor. la actionate că mărimea pe 
în Care se află parametrii populaţiei (1, 0) este controlată de: + 5 
-- nivelul de. probabilitate inna (direct po, é 
- $ (direct proporțional), > | 
- mărimea (volumul 2) egantionului le PEN a | | 
„Dintre aceste variabile una (s) este dependentă de datele AR | | 
| . Rămân celelalte două, care pot constitui elemente de alegere deliberată i în; | 
„ funcţie de scopul şi natura analizei şi de gradul de acuratețe cerut. | 
„Să presupunem că intervalul în care se află u, cu o probabilitate) | 
„dată, ni se pare prea larg şi dorim să-l restrángem, ba chiar să-i fixăm 
dinainte limitele. Acest lucru este. posibil prin creşterea volumului ! 
easto până la un anumit număr de valori. Dar câte? . 00 b 
„Rezolvarea ui ¡anal e PN de, e simpla, Intervalul « are forma r 


| 
Y 


E general. 


Ga, | „ES Fu, ES) e E u, p—s, , Fs, Pan 
E Eat azil JR. 0 
Pentru a fixa dinainte limitele intervalului gim Valoarea 1 necesară expresiei n 


care se adună şi se scade din media aritmetică: q le = = yo deci intervalul 


n: Da ADE 33 
E (UA 
` ~ e o . 


Na: fi & -c, X 7+0), Din expresia « c = ups scoatem pe n si si problema 


e rezolvată. i RI i de F pa fi: : e 
| | Ín exemplul de mai sus, să presupunem că dâzipale ca pu să A difere dex i 
“cuză loc/com, la nivelul de pro obabilitate de 95%. Avem 247,54 (reamintim: 
că în Anexa II sunt date probabilitățile corespunzătoare unor iniapiije. situate i. 
| de O singurá parte a mediei) = „96 = 2 ô = 26 34; c = PA 
las Ô _ 226,34 pa 
yn = gl a 10,53 =n = (0059) =~ At valori. 


„Verificarea poate fi făcută foarte e uşor, 


A, 3, Veis mer s siatisttee © 


A 3. 1. potes statistice; 


Eat pi od Obi Saig bi care PAR e datos: 


ho: p ii: procese cu “ajutorul metodelor statistice este interesat î în primul rând - 


-=de caracteristicile populațiilor din care provin „eşantioanele de lucru. Alcătuite > 


i după anumite reguli, eşantioanele , nu au alt rol decât acela de a servi ca punct de 


e SENi 


de plecare pentru o serie de inferențe asupra carac racteristicilor (necunoscute) 
"ale populațiilor, pornind de la caracteristicile cunoscute, dar fără o relevanță 
intrinsecă, ale eşantioanelor. Aceste inferente (concluzii logice fundamentate 
statistico-inductiv) sunt numite ipoteze statistice. Ca orice ipoteze de lucru, 
„şi cele statistice se cer verificate, iar verificarea lor se Ep E É 

intermediul unor q patriei numite / seste statistice. i PEN 


E tn. gasta cu alte sosi cola si Netificito în pa 
> ştiinţifică din diferite domenii, ipotezele statistice prezintă câteva 
particularităţi i impuse de fundamentele probabilistice al nen statisticii a nat că 


sia 8) ÎN marea majoritate a ¡tocados ipotezels s statistice se > formulează 
în berii) existenţei unei diferenţe: diferenţă între parametrii de sondaj şi cei 


„al populaţiei; diferență între parametrii a două sau mai multe populaţii, 
ps diferență între o distribuţie de frecvenţă empirică şi una teoretică, sau între 
+, două distribuții empirice ş.a. Testarea ipotezelor înseamnă, în acest caz, 


evaluarea gpl de. Smnificapie’ sau de siguranță statistică a ml 


? | E diferenţe. . | 
„Fireşte, cit bă testării sunt a natură probabilis, altfel s spus s cancordazița 


z diferitelor ipoteze cu realitatea se realizează în limitele unui anumit risc 
_ (probabilitate) de eroare acceptat (şi stabilit) dinainte, Acest risc este cunoscut ; 
sub denumirea de prag sau nivel de pei io al testului ia Ep: 


i Verificările ipotezelor statistice. 


i b) lipsa unei sigurante depline face ca ala verificarea 1 unei ipoteze 

TI “statistice să fie. posibile « două tipuri de erori: E 

o respingerea ipotezei, atunci cánd, în talia ea a este adevărată. 

AN Acest tip de eroare este cunoscut sub numele de „eroare de ordinul I” şi ea 
4 De cerectarea mi ido ra aceea că nu .. nişte generalizári 


= inductive care, ulterior, ar putea deveni: puncte de plecare pentru demersul 
cognitiv complementar, adică cel deductiv; - E Mo | 

le gi ia acceptarea ipotezei, în condiţiile în care în realitate ea este falsă 
„(eroare de ordinul 11”). Acest tip de eroare este mult mai periculos pentru A 
- cercetarea ştiinţifică, căci furnizează generalizări false care, apoi, constituie | 

= puncte de plecare pentru demersul deductiv, erorile propagándu-se în lanț de- . 
„a lungul spiralei inductiv-ipotetico-deductive care stă la baza progresului 
ştiinţific, bi TEEN N WIE ei a 


| SA | + Este remarcabil faptul că, de regulă, ipotezele formulate în practica i 
„cercetării ştiinţifice au tendinţa de a se baza pe nişte diferenţe observate în 
urma prelucrării datelor de sondaj — „ diferenţe cărora spiritul analitic, 


„observate se datorează doar întâmplării (eşantionnele fiind alcătuite după - 
„regulile selecţiei aleatoare), atunci creşte riscul unei erori de ordinul II, adică 


ofi înclinat să construiască eşafodajul explicativ. Această ipoteză inversă este | 
+ PUnoscută în statistica inferenţială sub denumirea de ipoteza nulă (a diferenţei 
| ipoteza curentă de lucru devine o ipoteză 


„II (mai nocivă pentru deniersul știintific, după cum am văzut), chiar dacă 
„Cieşte corespunzător riscul unei erori de ordinul Î. o e ei 


„Un test statistic este un criteriu (într-un sens mai larg -o 

„ tehnică) pentru verificarea unei ipoteze statistice, constând + 
În calculul unei statistici si stabilirea unei reguli prealabile 
„de acceptare sam respingere a ipotezei nule Ho, cu o 


N ps < 


| anumită probabilitate de a desd o decizia, ds 
Din defi iniţie reiese că elementul central al unui test este statistica acestuia. 
| Statistica testului este o funcţie de valorile concrete ale egantionului: | 
AR D i Ansamblul valorilor posibile ale statisticii defineşte o variabilă 
„ (Caracteristică cantitativă continuă) aleatoare a cărei i dl statistică este . 
utilizată t penin verificarea ipotezei nule. € 


OS tuturor albie. posibile ale ı unei statistici se împarte în 
două regiuni disjuncte şi complementare (vezi fig.4.7): 
| a) regiunea de acceptare — o mulţime de valori astfel încât, dacă 
valoarea calculată a statisticii aparține acestei regiuni, se acceptă i.n. Hy; 

b) regiunea de respingere (critică) — o mulțime de valori astfel 
3 încât, dacă valoarea calculată a statisticii aparține acestei tepi se de | 
i.n. Ho. | | a GO | 


"a Q (vezi fig. 4, 2 se numeşte prag (nivel) de sl cuie al 
testului şi reprezintă probabilitatea ca pri de peur nete nl a i. n. 
H, să fie eronată. 
În funcţie de concluzia testului interpretarea cule de eroare se hac astfel: 
| Ji) se acceptă i.n. Ho - atunci există riscul (probabilitatea) ca în a% 
- din cazuri aceasta sá se raa otsi; neadevărată Viia erorii de; | 

ordinul ID; | | 

| | 11) se respinge. i.n. af - atunci există tacit ca în a% din cazuri. 
| aceasia să se dovedească, totuşi, adevărată (piscul erorii da ordinul D. 


` Există o mare varietate de teste statistice, Sp mai simple, altele 
foarte sofisticate. Marea majoritate a lor verifică (testează) semnificația d: 
statistică a unor diferenţe de genul celor menţionate în paragraful anterior. În 
funcţie de modul în care sunt considerate difeeniele ie se aia 
„9 grupare a testelor în două categorii: 

a) teste bilaterale — sunt acele teste la care regiunea de respingere 
(critică) apare sub forma a două sectoare ale curbei teoretice de distribuţie a 
- Statisticii testului, cele două sectoare fiind situate la extremităţile curbei. Prin 
urmare nivelul de semnificație c a este distribuit în mod egal (a/2) între ni e 
două sectoare (vezi fig.4, 7-b). că, dă 
Testul bilateral se aplică atunci când dudan nulă H nu lides decát 
existenţa u unei i diferenţe, nu Şi seapel (direcţia) acesteia - de ex. 0 Pm dar 
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„cunoaşterea sau nu a | 


„„. populațiilor -din care 


muc.> C, sau 6; ¿<0, Ahmi când s se precizează i scut dierenţei se se aplică 
vin test: din cea de-a doua categorie : — e 
Y b) teste unilaterale - — la care regiunea critică est plasată la unul cgin, 
¡eapetele curbei teoretico 1: eee | 
-de distribuţie a statisticii. | > PRES 
„testului (vezi fig.4.7-a), | AX 
Rezultă că un test din |... LN 
„această categorie porie fe Panen i fi a 
unilateral- Citi meg în iti | 


: ati Be egiunea ca de acceptare Ea e... AN 

ARA sei e OR it VA e | | cenigereteriuică) A 
FE ei AP ur în 

clasificare a. testelor |. 


„statistice: ca cont de] 


digi  zegiunea de ES de ——jregiunea de: 
unor . parametri ai |. respingere ceptare _ respingere 


“Figura 47, Regiunile critice ale distribuţiei E 


i „tovin esantioanele statisticii unui test unilateral (a) sil bilateral nl F 


“analizate, cani şi de - 
“adoptarea sau nu a unor E | | i al e 
„presupozijii în legătură cu al de. distribuţie teoretică urmată Me e populaţie 
„respective. În felul acesta se disting două tipuri de teste: >: -~ 7 
18) teste parametrice — sunt testele care presupun cunoscute Pp , 

l caracteristici ale populației originară (u, o, tip de distribuție etc.) şi ele sunt - 
“relevante numai  Jacă presupunerile: sunt . valide. „Cele „mai. i frecvente 
; presupoziții Ja aplicarea testelor parametrice sunt: | 
"ia A - populaţiile sunt distribuite normal; „n ie ale d 
„= eşantioanele au un caracter aleator (observaţiile sunt at independente); 
„= populaţiile comparate au aceeaşi variantá (0, = o); 3 
„= datele de observaţii sunt din categoria celor cantitative continui. 

$ „Cele mai uzitate teste din această categorie sunt testul nb” al. lui i 
l Student şi testul F” al lui Snedecor. E £. da Aa 
- b) teste neparametrice — sunt acele teste. care nu fac" nici. $] 
presupoziţie în legătură cu populaţiă originară, cu excepția. independenței A 
„observaţiilor şi, poate, a continuității subînţelese 1 în şirurile de date. Deoarece - 
“nu pretind cunoaşterea unor parametri ai populaţiei, testele neparametrice pot. 
fi floa nu numai în cazul datelor cantitative stii: sua ci u > <= : 


pz% 


w 


Si 
E NI 


„cantitativ discrete, calitati ordinales: şi chiar calitative nomine a si 
; Me “Cele mai uzitate tehnici destin sunt t testut Mn” Gipit i 
„testul | Kolmogorov-Smirmov, | bi | E 


Tery de ¡pal testului ales pentru EN unei ipoteze de i 
„mer în aplicarea acestuia se parcurg: obligatoriu următoarele etape: a 
KER Definirea in: Ho sia ia. Hp Această primă etapă este extrem 
lei po ati căci o: formulare incorectă a ipotezei nule H, atrage după sine 
ic lipsa de validitate a deciziei adoptate şi a interpretării concluziilor testului. . 
'. Hotărâtoare este, aici, experiența cercetătorului în ce: priveşte aplicarea 
testelor statistice, pe. Mae o bună sati a plina oii de 
ipoteza de lucru. îi H 
22 Alegerea nivelului de semnifi icaţie a al testului. Dacă tiggi aiit. 
-Ñg reprezintă probabilitatea de a lua o decizie neconformă cu realitatea, z 
K atunci cu cât a este mai mic, çu atât riscul de eroare este şi el mai redus. 
„Cele mai frecvente valori sa pintar o sunt 0, 05, 9, Şi EiS o, 001 imi 5, d 
“Și O, 1 da | ți 
e jo Alegerea statisticii testului - — adie a lei bare 
“a cărei lege de repartiție (distribuţie teoretică), cunoscută, să servească drept. 
| eriteriu de decizie. Alegerea statisticii înseamnă, implicit, alegerea testului. 
k: -aplicabil î în condițiile date, având în vedere că testele statistice dietă între mÉ 
4 în primul rând prin statistica utilizată. A | 
4* Stabilirea regiunii. critice — i iz, sanie el Aiai al 
„valorilor statisticii pentru care, dacă statistica. calculată. intră în acest 
„domeniu, sé respinge i.n, H, (şi se acceptă ca adevărată i.a. H,), cu o 
` probabilitate a de a greşi. Regiunea critică se identifică cu ajutorul tabelelor 
„sau graficelor specifice pentru legea de repartiție (distribuţia teoretică) urmată 
„„de statistica testului, tabele sau siea care sunt oferite în i literatura de. 
| specialitate. / | i 
l 59 Luarea deciziei: AE a eiia ipotezei iik H. Decizia 
„Îuată permite. o serie de concluzii şi interpretări ulterioare bazate pe 
generalizarea condiţiilor sugerate de datele de sondaj şi pe informaţii specifice | 
` domeniului din care provin datele respective. Aporta; luării unei decizii 
„corecte nu trebuie, în acest caz, să mai fie subliniată. ` A E A 
> An continuare prezentám cáteva dintre cele mai uzitate teste statistice, a 
„grupate i în er San ses, si neparametrice: SRL 


. A T 
i sui 5 
A ART, Y 
i 


MERA i, leste parametrice 


Majoritatea testelor parametrice presupun cunoscute media şi/sau i 


dispersia populațiilor din care provin eşantioanele analizate; deasemenea, ele 
admit unele presupoziţii în legătură cu distribuţia statistică a populațiilor 
respective: (de regulă, distribuția normală). Vom prezenta câteva testa 
pos grapan e numărul de pati ie luate în considerare. 


| a Cazul unui singur ret a în acest caz testele pte se mai 

“numesc şi teste de semnificaţie (a unui parametru de sondaj, în raport cu 

“parametrul in sau feste de apartenenţă (a mea la peensas 

i isa dată | 
| Practic, un asemenea test evaluează semnificaţia difeal dintre un 


= parametru de sondaj (x sau s) şi adevăratul pana tru vide rad (y, 
respectiv 0), considerat cunoscut. ha, 

CEU Dacă esantionul este suficient de mare e(n > 50; Mar mai bine n > 100) 
i Şi se cunoaşte oa i Ace onan din care OaS Stii anul, atunci se 
„poate aplica testul Pr» ye 
Sta.istica acestui test este de forma: 


e LN 


| dei “ai de 
Ea exprimă, după cum se rii, diferenţa dintre cele două medii î în hiir 
de erori standard ale X ; ca variabilă aleatoare aceasta urmează, deasemenea, 
distribuția normală. Valoarea z calculată o comparăm cu cea teoretică (extrasă 
- din tabelele distribuţiei normale) corespunzătoare nivelului de semnificaţie a 
“ales; dacă valoarea calculată este mai mare ca valoarea tabelată, atunci ea 
intră în regiunea critică si in. Fo va fi A. | 


ES, Un studiu efectuat de o grupă de dla de la Facultatea 
de Sociologie din laşi asupra veniturilor populaţiei din municipiu debutează 
cu prelevarea unui eşantion aleator format din 100. de familii. Pe baza 
eşantionului se doreşte estimarea veniturilor medii ale populaţiei. 
Îndrumătorul grupei de studenţi are motive să creadă că eşantionul prelevat 
„nu este reprezéntativ, în sensul că familiile cu venituri medii şi mari sunt 
„Supra-reprezentate comparativ cu cele care au venituri mici. Datele de 
recensământ (lista completă a familiilor, cu veniturile lor) furnizeazză p = 

120. 000 lei Şi 0 = 30, 000 lei. VEON mega calculat pe baza esantionului | 


Sc 


A 


„este X= 130. 009 lei. Are îndrinătorut lu să creadă că spatial este 
- nereprezentativ sau, altfel spus, că eşantioul nu aparţine populaţiei analizate? | 


Dacă da, atunci diferența dintre. 4 şi x trebuie să bv statistio semnificativă. a 
“Etapele de lucru: --. F 
© definirea i.n. Ho: Hobbs va ñ ista care maá (maw i 
ipoteza cu care s-a pornit la verificare, adică aceea că eşantionul este. 
_nereprezentativ. Prin urmare i.n. Ho se va formula astfel: nu există o 


diferenţă semnificativă între y şi X, faţă de i.a. H; p<x; 
0 alegerea nivelului de semnificaţie « a — să zicem 5 dă 
__€ calcularea statisticii testului: id 
“za žen 130.000 - 120.000 _ do. a de 
el a 30.000// 100 zii or 


„e stabilirea regiunii critice: întrucât a fost precizat soii diferenţei y 


dintre y şi X, avem de-a face cu un test unilateral, în cazul căruia regiunea 
critică corespunde unui prag de probabilitate de a%.. În tabelul distribuţiei 
normale (Anozai D unei probabilitäți de ia îi elisa o nalgan: u= 
1,65. 


e ie a valoarea z calculată NA mai mare decât „APĂRA N 


tabelată, conchidem că diferenţa între y si X este semnificativă si, deci, 
Tespingem i.n. Ho. Prin urmare, există o probabilitate de 95% ca esantionul 
să fie nereprezentativ pentru populaţia din care a fost extras, rămânând un 
risc de eroare de 5% atunci când facem această rug | 
| “Se an bz cá > a a avea in aer | 
A . a 

Jx “Dacă esantionul este : mic ONO? si nu eatioagtear pe O, atunci în 
locul isis +”. putem folosi testu! ,,1” bazat pe distribuţia omonimă a lui 
Student. Statistica acestuia. este asemănătoare cu cea a testului „z”, cu 
Y deosebirea că în locul erorii standard a mediei, bazată pe o (necunoscută, în 
„acest an da se > calculează e eroarea a mt d a a mediei T baza celei mai bune 


F 


y in tabelul distribuţiei n normale sunt ed probabiliil e cao stea oarecare să ñe mai 
mică, sau cel mult egală cu valoarea u corespunzătoare (reamintim că valorile u sunt valorile 
standardizate ale variabilei distribuite normal). Pe de altă parte, statistica „2” a testului esta şi 
„Ca tot o văriabilă standardizată, AAA normal, ale boa y dao pot â Aaa ad direct cu 
Valorile u din Anexa... a EF i 


— estimafii a 0: ES, = In t Dacă inlocuim pe ĝ cu formula de calcul ce ] 
„include corectia Bessel, atunci dupá cáteva transformări aritmetice obținem | 
„expresia de la numitorul statisticii testului pf: | (Peer! 
IN DI 


Sl > 


ns 


n-1 KA Mm-1 


- Deci statistica testului va fi: 


- estimaţie a o, calculul abaterii standard de sondaj fiind suficient. Y 
e - Statistica testului urmează O distribuţie uşor diferită de cea normală. 
Însă unz dintre presupoziţiile acestui test este: aceea că populaţia din care - 
-. provine eşantionul urmează o lege de distribuţie normală; presupozitia trebuie 
verificată, mai ales atunci când volumul eşantionului este mic (cazul de faţă). 


„2. Cazul a 2 esantioane. Tehnicile parametrice bazate pe 
_ considerarea a două eşantioane aleatoare şi independente! se mai numesc şi 
teste de comparare: compararea, de regulă, a unor parametri de sondaj pentru | 

„a decide apartenenţa eşantioanelor la populaţii diferite sau nu, în funcţie de 

© concluzia testului. Şi în acest caz testele evaluează semnificaţia statistică a 

„unei diferenţe — cea dintre doi parametri de sondaj (medii, în mod obişnuit). | 


i 
A MEIR pila Spa PER AE e A 
"După cum se observă, nu mai este nevoie să se calculeze cea mai bună. 


te Testele cele mai uzitate sunt analoage cu cele de la cazul unui singur 
eşantion, adică testul ,2” şi testul „I”. Diferenţa este dată de faptul că se. 
- compară între ele cele două medii de sondaj, fiecare dintre ele fiind afectată 


N NN E NN 


de două eşantioane extrase din aceeaşi populație se numesc independente atunci când 
„constituirea unuia dintre ele, după regulile sondajului aleator, nu influenţează în nici un fel 


- constituirea celuilalt. : 


; ai O eroare aie Din această. vos. Statisticile: testelor ` vor dd ta): 
a considerare aşa-numita eroare standard a diferenţei dintre mediile de sondaj, 
care se. obţine pornind de la următoarea regulă (matematic demonstrabilá): 
varianța sumei sau diferenţei a două medii de sondaj este agală cu suma - 
varianjelor celor două medii (reamintim că varianţa unei medii de sondaj este — 
pătratul erorii standard a ali emi Prin pole vano eri a . 


va fi: ta 
ar și 
aiz, zl Ey PE 
iar eroarea a standard a acestei diferenţe va fi ridai pătrată a varianței: 


Această eroare standard este! folosită, ca şi la testele anterioare, 
pentru standardizarea („normarea”) diferenței dintre mediile de sondaj, astfel ` 
încât aceasta să nu fie exprimată în sii i absolute, ci în număr de. erori `- 
standard. 

Având î în vedeai toate acestea, Statisticile oiid două teste se vor 
modifica, î în cazul a două eşantioane, în felul următor: .  .. aia i 

-© testul „z”, care se aplică atunci când eşantioanele au volum ide: $ 
(n>30), iar abaterile standard ale celor două populaţii pa A din care 
provin esanticanelo sunt cunoscute: 


| | am, + oln, | | TE 
Pra testul e m, recomandat atunci când eşantioanele au 50 mic. 
(n<30), iar abaterile standard ale celor două populaţii (normale) nu sunt 


cunoscute — - situaţie. în în care se lucrează cu cele mai bune estimaţii ale 
acestora: | udat ¡dit S ri tnt i sd 


y n, + õn, 


Dot (după Giza. 1068) în cadrul unui ră comparativ 
asupra a două bazine carbonifere se e aleg la ns din fiecare si ca | 


10 puncte de. extracție (mine), împreună cu producţiile acestora într-o 
perioadă dată. Se cere să se stabilească dacă între cele două bazine există O 


diferenţă statistic semnificativă în ce priveşte producţia de cărbune per mină | 


(deci, dacă pi, 7 Hy), admiţină că dispersiile populațiilor sunt egale 


-- Parametrii de sondaj implicați în aplicarea testului „f” sunt: 


10 mine. A N e bagă: kal pi wV 
| — Ja al doilea bazin: X =0,34 mil. tone; s = 0,05 mil.tone; 2, = 

10 mine. situa | Lp bad 4 PAE AE 

| “Etapele de luca: — i a Ri 

„a definirea i.n: Hp, Este clar că acceptarea existentel unei diferente 


semnificative de productivitate între cele două bazine carbonifere poate servi 


ca punct de plecare pentru o serie de explicaţii cauzale în ce priveşte gradul. 
general de dezvoltare industrială a regiunilor din jur, întensitatea fluxurilor 
comerciale cu acest combustibil, importanţa relativă a bazinelor în complexul: 


industriei extractive nationale etc. De aceea trebuie evitată, pe cât posibil, o | 
eroare de ordinul I (acceptare unei diferénje semnificative, în condiţiile în 


care aceasta nu există în realituie), încâti.n.H, se va formula astfel: mu există 


o diferenţă semnificativă între cele două bazine în ce priveşte producția de 
cărbune/mină — si aceasta este ipoteza supusă testării, Dacă ea va fi respinsă, 


atunci va fi acceptată ipoteza alternativă — arme aceea că diferența actuală 


dintre cele două bazine este semnificativă, ea corespunzând unei diferențe 


reale de productivitate medie a minelor. d şi i | 


e aleperea niveiului de semnificaţie œ a testului, Reamintim că o 


reprezintă probabilitatea-de a lua o decizie greşită în urma aplicării testului; 


cu cât œ este mai mic, ci atât această eventualitate este mai puţin probabilă. 


Se observă, însă, că reducerea n.s: a înseamnă, implicit, o scădere a şanselor 


"de a respinge î.n.Ho, intrucát regiunea de respingere se reduce şi ea în mod. 
corespunzător. in acelaşi timp, însă, se diminuează şi pericolul de a clădi un ` 


, dacă sc acceptă ipoteza de inegalitate a dispersijlor, atunci aplicarea testului „se face 


după un algoritm întrucâtva diferit de cel prezentat mai jos; principala diferență constă în modul - 
de calculare a gradelor de libertate pentru statistica testului, cu ajutorul unor formule ce iau în 


consideraţie dispersiile de sondaj gi Volumele esantioanelor. 


705 Z 
d A 


- — la primul bazin: X, = 0,30 mil.tone; s = 0,042 mil.tone; 1, = 


întreg efi aj. explicativ pe o difez ren de toată care în realitate nu 
„există — fapt Care, din punctul de modere. al cercetării științifice, constituie, 
un avantaj clar. | 
De fapt, alegerea n: s, îi detiade botărător st rolul fenomenului: vizat 
de testele statistice în. ansamblul factorilor care influențează procesele şi 
fenomenele studiate, În exemplul nostru, dacă este dovedit prin cercetări 
anterioare că producţia. de cărbune/mină (fenomenul. vizat de test). este 
factorul hotárátor pentru gradul de dezvoltare industr ială, comercială etc. al 
- unei regiuni carbonifere, atunci se poate alege un n.s. œ mai mare. Prin 
aceasta, chiar şi o diferență actuală relativ mică poate deveni „statistic 
P semnificativă”, lucru cu care putem fi de acord, dată fiind importanța 
prezumată a factorului "producţie de cárbune/miná”.. Dacă, însă, factorul 
respectiv este doar unul printre mulţi alţii, fără o importanţă deosebită in cé 
= privește gradul de dezvoltare economică, atunci vom alege un n. s. a mai 
„mic, astfel încât, pentru a putea fi declarată „statistic semnificativă”, 
diferenţa actuală dintre bazine tiebuie să fie mult mai mare, ; 
Ín exemplul nostru, să luám o = da 
TR statistica testului: Aaa 


i +ô PIN UR. 


“a Eiet regiunii de respingere (egiunii crítico) A E avem ds 
a ien cu un test bilateral (nu a fost precizat sensul dife zenţei dintre cele două 
bazine) vom căuta în tabelul cu' valorile critice 'ale variabilei aleatoare „” 
(Anexa IT) valoarea ce corespunde pragului de 2,5% (0/2). Dacă valoarea 
£ calculată depăşeşte, ca valoare absolută, pe cea tabelată, atunci. statistica 
di testului întră în regiunea de de respingere şi, deci, i.n. Hg va fi respinsă. 
„Intrarea în tabelul distribuţiei ,,1” se face cu n.s. ales (în cazul nostru, 2,5%) ' 
si cu numărul gradelor de libertate ale variabilei aleatoare ,1” (18). 
“Numărul gradelor de libertate ale unei variabile aleatoare se obține 
scăzând din numărul total de valori numărul. de relaţii. soi gi care 
leagă între ele valorile variabilei respective, 4 
O relație independentă este o văi care implicá numai valorile 
„„ dintr-un eşantion, fără a include parametri calculafi cu ajutoru! altor relaţii. 
0 relaţie de acest gen face ca una dintre valorile eşantionului să nu mai poată 


„Varia aleator: într-adevăr, dacă, de exemplu, se dă media Y a unui eşantion 
cu n relatate, numai n-1 dintre acestea pot căpăta valori o, în timp 


ce una dintre ele va avea o valoare predeterminată, astfel încat să producă 


| media aa A pă ep age PAS EEE E 
„În formula de definiţie a statisticii „7” între elementele fiecărhia 
- dintre cele două eşantioane există câte o relaţie independentă de forma 


X= 


-standard nu introduc alte relaţii independente). Aceasta înseamnă că numărul 


gradelor de libertate, notat prescurtat g.l. sau », va fi egal cu numărul total 


de valori (1, + n;) din care se scade numărul de relaţii independente (două): 
als Pa ara OE 218 > 
-| Intrând în tabelul distribuţiei ,,£”, pentru 0/2 = 2,5% si g.l. = 18 


| găsim că valoarea critică corespunzătoare este cuprinsă între 2, 101 şi 2,552, 


deci :ai mare decât valoarea £ calculată. ' 


- e întrucât valoarea calculată este mai mică decât valoarea tabelată 


| (critică), tragem concluzia că diferenţa cbservată dintre producţiile/mină din 


- cele două bazine carbonifere nu este statistie- semnificativă; altfel spus, nu 


_ respingem i.n. Ho, ştiind că există, totuşi, O probabilitate de 5% de a greşi 
acceptând-o. să NIRO în o e ee e > dp) | 


- 3. Cazul mai multor esantioane. Pentru testarea diferenţelor dintre mediile a 


“mai mult de două eşantioane se utilizează testul „F” al lui Snedecor (testul 


- raportului varianfelor). Acest test are. la be ză o.procedură ceva mai complexă 
cunoscută sub numele de „analiza varianfei”. Analiza varianţei (AV) poate 


- fi considerată o extensie a testului „2”, cazul a două eşantioane: se lucrează, 


într-o primă fază, cu mediile eşantioanelor, iar premisele sunt aceleaşi — 


„populaţii normale. eşantioane aleatoare şi independente, la care se adaugă 


„prezumția că deviaţiile standard ale eşantioanelor sunt egale. Testul propriu= 
zis, însă, ia în considerare două variante estimate: varianfa valorilor în 


| “interiorul fiecărui eşantion (în jurul mediei) şi varianta mediilor eşantioanelot 
- în jurul mediei generale (varianfa între eşantioane). Cele două varianfe sunt 


$ apoi analizate sub aspectul raportului lor (şi nu al diferenţei dintre ele). - 


Reamintim că varianfa este media aritmetică a pătratelor abaterilor valorilor 
unui eşantion de la media acestora. | | ge El 


a ` E zi P 


Dacă mediile esantioanelor nu diferă semnificativ între ele, atunci 


+ varianţa „între grupe” (eşantioane) va fi aproximativ egalá cu cea „În 
interiorul grupelor” (eşantioanelor), iar raportul lor va fi apropiat de 1; deci 
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(formulele de calcul pentru cele mai bune €:.. mafii ale abaterilor 


“eas 


nu există diferent: a reale între medil: diferențele în între tei păi, fiind pe DON i 

=variantei din interiorul acestora. Dacă mediile diferă semnificativ, atunci 
raportul varianţelor va fi clar mai mare ca 1. Acest raport al varianțelor, 
notat cu F, reprezintă tocmai statistica testului omonim şi el constituie o 


dd variabilă aleatoare a cărei distribuţie (teoretică) a fost stabilită de Snedecor. 


Modul de prezentare a datelor: pentru analiza varianfel este redat în. | 
- tabelul 4,1, În tabel s-a notat cu X, media unui eşantion o oarecare ej, iar cu | 


| x, media generală a valorilor tuturor celor k egantioane. | gt 


"Tabel 4.1. Fora generals de prezentare a a datelor pentru analiza v variantel | 
E feat unei. dig wt a variabile). _ | 


Ez (egantioane) - 


| Numărul de valori 


“Analiza varianţei titi într-o pea fază pai cu. pre de 
pătrate ale abaterilor de la medie (SPA), pentru fiecare eşantion şi pentru cele 
- kesantioane. Aceste SPA sunt numite variaţii (nu varianţe!). Avem mai întâi 
variaţia totală, pentru ansamblul Nal tuturor valorilor din cele k aas 
„care se calculează cu ajutorul u unei relații pi forma: | 


jii “ O DO 
y DEAN (SP A) totală poate fi repartizată (alocată) pe ee două componente 
- ale sale (SPA „între grupe”, respectiv „în interiorul grupelor”), astfel | încât 


„în final să se poată calcula cele două variante menționate mai sus. |, 


pod Dacă vom lua un element oarecare dintr:un, baa ai putem | 

A „sere, o relaţie algebrică, anal. | aie. 

ea ul i Daia a data d - &, - 3). + E JA E , F. A Jotas. 

dd adică scădem si dona X, jo Di felul acesta diferenta intre En şi i este . 
exprimată ca sumă. a „două cantităţi:. 10) „diferenţa. între E si; media 

h J ; Sandoni (rupei)« din care ea face parto si io fort intro X; Hen şi x. 


ay. a 
a 
4 


* Pentru a a ajunge i SPA-uri; ridică ră pietat relaţia si mai sus: 


> XP = (e, AS + 2%, 3 Ey TY: + E, pa 
Fi poi aplican operaţia: de însuinare la Amd membri : ai ecuaţiei - — caz, în caro” 
termenul central din membrul pia devine aul i aci e mediei. 


pa aritmetice): das 


ike Ay ijen > + iha- EE i 

vi E =l/= ! | ia 

n Petu a eres; Era mai ` j Pender estimafii ale varanglo 
$ E la SPA-urile. de mai sus se. Tone] la numărul de od de. 


$ eS libertate aferente: 


os „= pentru varianfa totală, g. L = Nal, cáci un n grad de libertate s-a. i 
l ‘pierdut prin calcularea xo ‘(ingura relație independentă între cele N valori); F 
= pentru varianfa „între grupe” g.l. = 4-1, căci fiecare medie este, 


PI a a 


A o 
CI i 


A tratată ca o o valoare individuală, un i grad de libertate Feet ap prii calculul t 


E A > paca varienta „în interiorul grupeloi”: se pe Aaa câte un ui de E 
A libertate pentu aea eos (prin calou mediei corespunzătoare), deci 

4 g = EN 4 A 
now ue menționat că salta a de la SPacuri este valebi 14 şi la gradele A 


- ET: rcir 


nos A 
A 7 
| "o 
PEE E 80 Ea t 
C m ss 
E. e e | 
DE e: 
, 


Acum pot. fi caiculala saita. estimate vea cele două | 
compon onte, iar raportul acestor estimaţii, adică T 
Pe a Fo ES varianja estimată mai mare. 

„varianța estimată i mai mica 


mái i atistica testului „Poe 
A- Ca cotele aferente” acestei: tape s se trec. de e regula în numi 
„tabel de ang liza a ani (vea tl ~ 2 terta O ale Ii 


Tabel 42. Forma. general a s tabelului de analiză a varianţei. NEN 


PA A E... ai să 
liere | grupe eS, Lal a] | seal D |. Fej he m ne Cs, îi. | 
În interiorul smpi | 3 ass | bula a IND, A m, J4 


TN Gi 


Valoare. F “catia se - compát. y cu priit ce F ‘wöretidk, yA 
corespurizătoare n.5. or al testului şi gradelor + de libertate” ale celor două 
„variabile estimate (Anexele IV gi V). Dacă Fusta < Finito: atunci diferențele | 

„ dintre mediile celor X egantioane nu sunt semnificative statistic, u caz poesi 


z roan 


ste pm O 


i ¡Edic sunt considerate semnificative. e A 


„De remarcat că valorile F tabelato sunt mai mari, sai pi i egale 
„Cu 1, ceea ce înseamnă, că testul. „F? este un tesi. unilateral. pa, 
 Varianta estimată mai mare constituie numărătorul raportului). . Ro 
Wo Să precizărm, în final, că procedura i descrisă, mai sus constituie aja 
„numita, „anali p simplă á yarianjei’ ”. Simplä, deoarece cele k eşantioane. 
POTOSÍ pund lsk : modalităţi, ale. unei. caracteristici “calitative. nominale său. 
=o ordinale, alităţile, respective. corespunzând unor '„populații”: ale căror 
medi suni. ur cu ajutorul AV, Atunci când! eşantioanele corespund. 
t modalităşilor a două sau mai multe caracteristici calitative, se vorbeşte despre. 
¿o analiza dublă a Varianţei” , repectiv .. „analiza. multipll « a varianţei”, M a 
a y analiză s statistică a căror Ecco depago ri acestui curs, 4 


` Topple {dupa Gregory, 1968). se: i “noa xi 


A ag: gropedolagie: dia ‘nordul. färii- (Pod, Sucevei). Fin “metodele sondajului | 
dl WE a . fost E Pa 3 veranda în usd ce artă ie ied | 


i sari de pe suprafeţe cu soluri diferite: pe substrat turbos, dezvoltate pe. 
mame, respectiv pe argile. Pentru fiecare tip sl sol : a font, alcătuit câte. un E 


„eşantion de 10 terenuri cultivate cu secară. 


i - Producțiile medii înregistrate. au foi oale de 24, 3 abs: (sol d 
turbos), 22,2 q/ha (sol marnos) şi 21,0 q/ha (sol argilos). Se pune întrebarea 
dacă diferenţele de productivitate între. cele. 3 eşantioane este. suficient de... 
„mare pentru a putea afirma ci. producţia de :cereale din zonă variază ` 
“semnificativ. în raport cu tipul de sol. Datele” de Tucru. sunt redate în tabelul Ed 
: de mai jos. Prelucrarea lor A asa Aeebțieia: expusă, mai Sus. conduce MA | 
următoarele rezultate: . 4 i ele E SI O de E E e 


ng 10. 


| 7 ES AA E fa y > = - 301, 5; 


ner 


„stau = SPA SPA = =. 301, s- 5s, 3. =: = 245, T 


|. Nr. de valori | = > 


de na nulă He: nu „i există Lo dilatat semnificativă ntre medii, en 
i de i i.a. H: există o n cap eee intre acestea. : | 
MAA a pi 

tie statistica testului: F = pi, 9, 1 = 3, 07. 


Zi ae = a (plănuit 


a 2 


SPA, = = È 106, E) j- = 55, a pp K i 


j productie de cereale nu i 
"+ variază semnificativ. în | 


q ` ngan or oritioă: n tabelul ¿arta k (anera v penru c a o. 
mr să; A 22 4n = 27. 

$ valoarea Fuster = 3,39 E vane 

eS deoarece |... 

vi i 307<3, 35, TY aocentă E mer | 
` ipoteza oulá H, deci |¿ 


aport ou tipul de sol, 


| “Sunt tehnici ¡de verificare: a pm statistice pia utile in a practica 
cercetării geografice, unde sunt frecvente situații cum ar fi ți 
`- nu se dispune de valori absolute (deci nu se pot calcula mile), 

: datele fiind sub formă de frecvenţe: (distribuții. de. frecvenţe); .. 5 
„= populațiile din care sunt prelevate esantioanele nu pra o logo. 
de distribuţie normală, su POE, și, RNG mu 80: ie ce i dle de Tege de. 
distribuţie urmează, x 
„Nefiind ceri iei de calculul unor. e parate ai puii: 


E (eşantioanelor) analizate, sau de presupoziţii cu privire la tipul de distribuţie 
` urmat de populaţia originară, . testele : néparametrice au un câmp de. 
Eo aplicabilitate mult mai larg. Singura exigentá pretinsă de majoritatea acestor. 
". teste este aceea ca datele să fie calitative ordinale sau sub formă de frecvenţe . 
(brute). Deasemenea, este hotărâtor modul cum este formulată ipoteza nulă 


A “Ho, care de cele mai multe ori condiţionează însăşi posibilitatee me: 


MZ testului, pe lângă corectitudinea concluziilor. 


dE mda Bistro ete epurate douk sunt mai dos utilizata: tel i 
PY f: testul ui Kokoon Apoy: ter E Mega a OO pi 


e “Testul „i, Este un test dativ i uşor. de le aplicas, pr este a pra 
Bn să fie aranjate corect, iar es de rezolvat să fie u una dad 


pentru aplicarea acestei metode. :- 

“Testul yx?” verifică dacă Piila i in să de id analizat diferă 

-> semnificativ de nişte frecvenţe probabile (teoretice) ce corespund unei ipoteze 
“prealabile, Această ipoteză prealabilă trebuie definită cu atenţie şi bine 


e MR astfel încât rezultatul aplicării testului să fie corect interpretat. i 
1 „Vom ilustra modul pad a acestui test cu jeeni unui pe A 


e 


y cap Gregory, 1968), J 


Să presupunem că trebuie făcut un studiu asupra unui număr, FĂ y 


“ferme considerate în relaţie cu caracteristicile lor de localizare. Pe un 
: teritoriu cu relief variat se prelevează un eşantion de 200 ferme, care sunt 
` grupate apoi în câteva categorii în: funcţie de caracteristica fizico-geografică 
- asit-ului: şes aluvial, terasă, versant, platou calcaros, platou grezos. Numărul 


- de ferme pentru fiecare categorie este dat în tab.4.3, alături de ponderea 

i suprafeţelor pentru fiecare categorie în suprafaţa totală a teritoriului studiat, 
a e sean olor: da soci clar că dee fermelor pe cele 5... 
e „+. categorii” este legată ` 
i de proporţia. 
3 mes 4. 3. cena celor 200 de e ferme p pe s tipuri, suprafe je J lor. 
¡Ses aluvial po PS! | “cea mai: bu 
terasă : . | T 408 OC Eb |... 35 1 |'sprafaţă, sunt 1 


erat 7-12 |: 210 2 | instalate cele mai 


platou calcaros | ra Bi BLARE AENA [male ferme. Pe de 4 


` {platou grezos S K o A Lo sd N pă D altă parte, distribuția 
7 200 - | 100%... | fermelor: pare să 


sai indice o localizare. 


i prefereaţială, dioiii gl RE si AA grezoase au un număr de 


_- ferme mai mare decât ar sugera ponderea arealului lor, în mt ce celelalte | 


ES categorii sunt oarecum sub-reprezentate. 


“Dacă dorim să găsim o explicaţie cazul pentra distribuția spaţială g. 
-a sit-urilor fermelor, una din problemele de rezolvat este verificarea ipotezei . 
sugerate de datele empirice. Dacă numărul de ferme de pe un anumit tip de 
„teren este legat în primul rând de frecvența cu care apar respectivul tip, 
- “atunci nu se poate argumenta că caracterele fizico-geografice ale acelui tip de 
„teren reprezintă factori ce favorizează (influenţează) amplasarea fermelor. - z 
i “Pentru a testa care din cele două posibilităţi este mai probabilă, a 
: piii testul „X2”. Ipoteza nulă H, o formulăm astfel: nu există o diferență. 
- semnificativă între cele 5 categorii de terenuri în ce priveşte frecvența 
amplasării fermelor, acestea fiind repartizate ` uniform pe întreg arealul 
“studiat. Altfel spus, distribuţia observată a fermelor poate fi dedusă 
| “satisfăcător din nara m ea pe Arg de teren în e me peisan A 


| studiat, 


- Statistica testului, notată cu cd se “calculează :pornind de la 


T diferențele între frecvențele observate şi. cele „aşteptate” sau „probabile”. 


< Frecvenjele ¡precip sunt Ecole care rezultă în cazul în care pini nulă Ho Y 
ar f adevărată. a 
T -Pontru fecaro diego di clasă) toc ridicată la pătrat BE 

AA. împarte la frecvenţa probabilă, în felul aceste eliminându-se variabilitatea de - 
da o grupă la alta (un procedeu similar cu gene maree o Prin opero 
e acestor bere standardizate” s6 obţine valoarea piai E i 


o rin 


Statistica Bo constitule: o variabilă dei a kI ids de ninas 

EE » ue de grupe/categorii), a cărei distribuţie teoretică este disponibilă . 
- sub formă de tabele (sau grafice). în tabelul distribuţiei „x2” (Anexa VI) se 
intră cu n.s. a al testului gi cu g. i. Dacă valoarea K anias > X ore» ne 
< one aflăm î în regiunea critică şi, deci, ipoteza nulă H, va fi respinsă. pe 
„În exemplul nostru, pentru a calcula: valoarea x? trebuie stabilite i 
i frecvențele. Cele observate (f,) sunt disponibile deja, iar cele aşteptate TA) se. 
“calculează pornind de la ponderea fiecărui tip de teren în. suprafața totală. 
(vezi tabelul de mai jos). Astfel, de exemplu, dacă şesurile aluviale acoperă 
10% din teritoriu studiat, atunci ar trebui (conform ipotezei nule ră ca 20. 

| cdi 108) din na e de ferme să fie situate în pesuri aluviale. mae A 


granm platou 
calcaros A | 


Statistica testului: x ap LE Pam 


y “ întabelul z] Ta 
i, distribujiei nX. E 

(vezi Anexa VI, p 
| „pentru g.l. = Sl. 


med valorile $ db 
` tabelate sunt molt. L on 


“mai mici decât 


. cea calculată, chiar şi la pragúá de semnificaţie a mici Ak s sau 1%). Este 
- clar deci ol ipoteza nulă H, trebuie respinsă, iar cuncluzia testului este că 
exista realmente o localizare preferentialá a fermelor în funcţie de tipul de 
teren — altfel spus, caracteristicile tg ete ale sibraloi hore sa 
E. semnificativ omiin fermelor. e | | 
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în exemplu! de. mai sus testul món a fost utilizat pentru analiza unei i 


| ya variabile — numărul de ferme pe diferite tipuri de terenuri. Acelaşi 
4 test poate fi; însă, folosit pentru compararea a două sau mai multe variabile A 
Care apar, ca şi la exemplul anterior, sub forma unor distribuții de frecvenţe. 3 
- (empirice). De remarcat că testul „x?” po ate fi folosit şi pentru compararea 3 
“unei distribuții empirice: cu. una teoretică, caz în care se incadeepzi în 
„ delagetiă aşa-nurmitelor teste de. concordanță (de adecvare). . 


„cazul comparării a „două sau mai „multe distribuții empirice A 


frecventele. observate; 


„core spunzátoare diferitelor. | à 
categorii - (grupe, . Clase) se. qa 


„prezintă. în mod obişnuit: sub. p 
forma unui ‘tabel cu.rlinii (r— | 


ye numărul de variabile comparate) i 


gi e coloane (e — numărul de: |- 
grupe). „Un asemenea “tabel. ei y 
„poartă. numele de. „tabel de. 

; „cunfingență.. MA E în GA: aaa EN 
Un exempiu pentru două variabile o cu trei i categorii apo) apere An tabelul E 


d arate 


'Frecvenjele ot otet sunt. X şi DS Escvenjele aşteptate se calculează ` 


| m destul í de simplu, sub forma unor probabilităi condiţionate de totalurile pe 


“linii şi coloane - sie exemplu lui sih îi cop teza > j eos i akpa "A 


pa cu formula Le Pi Deci pentru o orice celulă din tabel frecvenţa a 


probabilă se se obţine împărțind produsul dintre suma paie şi suma Dido Y 


O 


aferente. la frecvenţa totală N. Odată. determinate + pa sila perene 4 
i pwa e se calculează Supă: formula cunoscută: BP 


i jap fitze pins praia 2 fe dee ps irp 


g- pitawe marti 


Statistica astfel calculată este o variabilă aleatoare cu (r-1) (c-l ) grade J 


t de libertate. Valoarea tabelată (Anexa VI) se compará cu cea calculată, lar 


- concluzia testului. se caca ao que as es ca şi în pra unei iai A 


variabile. | 


CA 


| „Dati Ko olmogorov-Smirnov — este un test neparametric care, ca şi. 
testul ,x?” se utilizează în cazul acelor. eşantioane (variabile). ce apar sub 
formă de distribuții de frecvenţe brite; Deasemenea, ca şi testul „X2”, testul 


E K.-S. se utilizează atât pentru compararea a două distribuții empirice, cât şi 


pentru pia ele unei a a gi d cei cu. una teoretică e a | 
concordanță). Aaa ja 
- Pentru a Tiii a AR nin necesar ca ELIR brute să fe 
<, transformate în proporţii (frecvenţe relative subunitare). După aceea aceste 


` | proporții se cumulează, pentru fiecare din cele două distribuții de frecvenţe. 
-` Pentm fiecare categorie (grupă, clasă) se face diferența între cele două 
> proporții cumulate. În ultima etapă a testului se ia în considerare cea mai . 


. mare dintre diferente, a cărei semnificaţie statistică poate fi evaluată direct. 

| (deci fără a fi implicată în calcului vreunei statistici). Evaluarea se face cu 
-` ajutorul tabelului sau graficului diferenţelor maxime, în funcţie de mărimea ` 
E eşantionului de bază y pe baza căruia s-a alcătuit Stă: de rra 4 
TA (Aneta VID: T o E | 


pr Aaii aniei illea ilio de “precipitații la c o 
stație meteo, pentru o. perioadă lungă de. Gap, a condus la ua de 


| frecvenţe din tabelul de mai jos.  ... > 


A Pentru o lună Liniei nat de 30 zile frcveniele b brute ce > corospund celor -bi 


E. categorii (clase) sa fol respectiv 12, 6, 9, 3. “Problema. de dieta osti aceea 
-de a decide dacă între distribuţia teoretică” aht cea: a. EER "oars există 4 
ko o diferență semnificativă sau nu, ` 
„0 ipoteza nulă H, va fi, AMS aceea care > neagă cien unei . 
3 diferenţe semnificative între cele două AE E 
E tad ens. a5 h. IA EA 
e după cum s-a Văzut, ames y d A d 
statistica testului este reprezentată de acea diferență maximă între proporțiile 
cumulate aferente categoriilor (claselor). Deci transformăm mai. întâi 
frecvențele de mai sus în proporții, apoi calculăm proporţiile cumulate şi 
.. diferenţele respective (vezi tabelul de mai jos). Pentru distribuţia empirică 


pă a -iunii particulare, de 30 de zile) proporţiile se calculează simplu, | 


ep. re prea din cva olbbervate i la iii total de cazuri Rt Eo 


aee Ee E. 


EE se. sa peleado d | CE mm To, ZI mm | 2 10 mm T aun 2 E 


E 5 y 


ofn tabelul cu diferențele maxime i pita testul Kolmogorov-Smimov i a 
N usa VID găsim că pentru un eşantion de 30 valori (zile, în cazul nostru) ... 
şi am5%, aa teoretic. este mos: „Deci dalt între cele e pri s 


e este nesemnificativ statistic. 


d Aşa cum s-a strict testul K s. se PAR aplica şi în cazul a două a 
| iep | apti (distribuții empirice). Dacă se lucrează cu eşantioane mici (1<40), 
“atunci este necesar ca ele să aibă aceeaşi mărime, pentru | a putea folosi 
tabelul testului — aceasta întrucit în tabel se intră cu n.s. a şi volumul i E 


S eşantion (nu cu volumul total al celor două eşantioane), 


În cazul eşantioanelor mari (n >40) volumele pot fi ia iar diferențele a 
maxime corespunzătoare diferitelor nivele de probabilitate (semnificaţie) se 3 | 


Meri cu el y unor e foraj indicate « des Smirnov e. seed. Nerd: 


pe sr de "i 1,36 


AUA 
L 


| i ANEI ab dá 


= pentru n.s, 0:=0,1%: Bn. = 1,95|- 
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CAP, y. PROBLEME GENERALE PRIVIND Ae prijs DINTRE 
DOUĂ VARIABILE (NOȚIUNI DE ANALIZA EINER 


Sd. Nofiunen de relație Mnire două caracteristici - 


Una dintre întrebările fundamentale ale peoia este următoarea: 


L enisi o relație! oarecare între fenomene -situate în locuri diferite ale. 
eh spaţiului? (Johnston, 1978). Răspunsul la această întrebare oferă posibilitatea 
„de a sesiza eventualele structuri spaţiale, care funcționează de multe ori 
~ incifrat, greu de perceput cu ajutorul simțurilor umane. De asemenea, a 
“răspunde la această întrebare înseamnă. a putea avansa mai departe în 


cercetarea geografică, respectiv a ajunge la stadiul de a sesiza diferenfierile 
spaţiale. Adică la a răspunde la a doua întrebare fundamentală a geografiei: . 
locurile caracterizate de ii fenomen s sunt diferite între ele? fiha, | 


de d 


¡Baza de pornire Porta a se ii oradea sau td 


( x ‘relațiilor dintre fenomene cu localizări diferite este ads elementelor 
“- mulțimii studiate într-un tabel elementar. 


Să considerăm o mulțime M alcătuită din n gp eA (abeau tii) 


pl. i, + desocion de Son AOS Crece Malu aim ie motto. 


e Tebei pă spini A ned gr og Au AA AA 
“Legătură, Termenii de legătură şi de dependenţă permit să se precizeze noțiunea de relaţie : 


a) Noţiunea de legătură este simetrică : a spune că există o legătură între X şi Y 


> înseamnă acelaşi lucru cu a spune că există o legătură între Y el X (acanta Inscamak că valorile 
lui X şi Y nu sunt distribuite în mod întâmplător); . 


A0 b) Noţiunea de dependentă nu este simetrică, deoatece ea dă un sens relației: pemn 


că Y depinde de X'nu înseamnă acelaşi lucru cu a spune că X depinde de Y. De exemplu, salariul 
„creşte în general cu vechimea în muncă a lucrătorului. Salariul depinde de vec.u.ime. În schimb, > 
„Vechimea nu depinde de salariu, deoarece timpul trece pi fără mărire salariului. Bá 


Prin urmare, o relaţie, care presupune fi dependență între variabile, este mai mult 


 decât' o legătură, deoarece are un sens : ql pr ie 
ya paea (de Foiss aša E P N: > 


. .* 
yd “e . A S 
asi a d ie . 
` . ` - . ee u . ? : 
apa4 è ere A i .. a a 
|... e ps, sa =. i . . . 
. J . E . m e 4 di" 
” jr ` f . . 
a . . r . d 
. “al i Pie 
. peto ` . 
. 4 A, 
. 
. 


PA ie ch şi respectiv Y, YY Variabilele cormctaciaicio) 2 x şi ¡Fo i 


- calitative sau cantitative, continue sau discrete, Tabloul bea cate 


> corespunde acestei mulţimi are forma din tabelul de mai jos | 

„ Spunem că pentru mulțimea observată M există o o relație meai 
O dacă cunoaşterea modalităţii X, ae ca | 
- prezicerea, într-o oarecare măsură, 
ari Y, cores corespondente. 


Sa e o whati prao exprima ib formá ske 
; literară (calitativă). sau sub formă algebrică 
Y (cantitativă). Pentru a ilustra aceste două | 
` forme, vom considera mulţimea Ma statelor P 
„tropicale în e. 1985, fiecare stat fiind | 
- caracterizat © de douá variabile: ` rata 

cal Petria (X) şi mortalitatea | 
- infantilă masculină (Y). Aceste două variabile. | 
"iau, pentru fiecare stat i. i “n, e 4 
OX Ky X, si Yin Yo Aa ` 
0 a) Forma titersel: pr oaii 

"din Mi ia modalitatea X, a variabilei X, atunci 


„me putem aştepta ca modalitatea sa pentu -- | ; | E 

-variabila Y să fie Y, În termenii exemplului de mai sus, : se spune că „pentru y 
. mulțimea țărilor tropicale, la nivelul anului 1985, se observă în medie că, cu si 
-cât nivelul de alfabetizare a femeilor este mai i scăzut, cu atăt mortalitatea + 


> infantilă masculină este mai mare” 


„un b) Forma algebrică (sau funcționali): y = w. ian Y esto sei l 
: funcţie de X. În termenii aceluiaşi pent (Pra eva: 1 Fie: 1, 73 X+ 


Eo 38, 6, CUPE -+0,820, unde: 
d py = rată anaMfatietisinului ferheilor adulte în 1985; 
< X = rata mortalității băieţilor sub 5 ani, în -1989; 


| z 3.1): 
A GPKA urmare, se comia be dorai faptul că între două variabile 


e etis. o relaţie înseamnă a demonstra că atribuirea modalitáfilor lui X şi lui 

“Y pentru fiecare dintre elementele i din M nu se face la întâmplare, respectiv 
< a demonstra că valorile lui X depind de valorile lui Y sau că valorile lui Y... 
E depind en paionia aian X. De vreme ce se a. rupă tribini" retea 


A 3 dE 
y PX 
. 
i 90 E 


pi Ta w= coeficientul. de: me, intre cele două vacio crezi is 


3 


Pa dana aRt vamostăziă “modalitatea ăi a se posit E 
E * modalitatea. Y, (sau invers), se poate spune. că Ed p ro m se pa cani 
E. har dacă cele două variabile sunt coraje: Ad ES 


Hg sp Pe mai impla modaliteta de a pto dacă i două á variabile ema 
„.. corelate este studierea diagramei lor de dispersie, Diagrama de dispersie este. 
.... un sistem de coordonate rectangulare, în planul căruia se pot localiza punctele Ei 


j "06 corespund perechilor de valori XY (obținându-se un „nor de: puncte”). qe 


“ Mulțimea de puncte ce alcătuieşte norul se ordonează într-o anumită manieră, .. 


í - dându-i acestuia o anumită formă.. Aspectul norului. permite: carácterizarea 
. -relației prin intermediul a trei criterii: intensitatea relaţiei, forma relaţiei. şi 


sensul relaţiei. Dacă punctele prezintă tendinţa de a se apropia de o aceeaşi ` 
- curbă, variabilele respective sunt corelate, În' funcţie, de cele trei criterii, `. 
„„ corelaţiile pot fi puternice sau slabe, ` lineare sau neliniare, pozitive sau ... 
+ negative.. Lipsa unei direcţii vizibile a ordonárii pe care. ozena 
mana semnifică seo că variabilele nu sunt t corelate: oi 


E - Studieres relațiile! stabilite tntre dată valabile se catea îsi 
EY A al de felul variabilelor în cauză: calitative sau cantitative, discrete sau ` 
-, continue. Pentru a ilustra cele mai frecvente situaţii, vom analiza trei cazuri + 
M8 de e relaţii prin intermediul modalităților lor de studiu!::: >. pi 
8 1. = relaţia între două variabile discrete (cantitative sau calitative). i, 
6 cu paes k redus de modalități Sai pren x i m studiul tabelului de 
- porn coeficienţi de asociere; < ABB: 

| 2. - relaţia dintre două Varisbile cantitative Lois, sau d asimilabile A 
fi unor variabile continue. (k>n». pentru X şi Y): studiul coeficientului. de A 
„corelaţie liniară Bravais-Pearson (7); regresia liniară; zi 
„+ 3, + relația dintre două variabile calitative ordinalo e tan pentru si şi E 
ni Di D studiul coeficientului de rang ania 0). Aa e 


| ! Trebuie i bici sa osul ie ie varia i alone poti ine a ut i 
' dintre cele go: la ... eu m! erai Pm gat m regasi ya ; 
MONI, a: PA ma Ra EA E cn în ERAN O E AAN, 


i „ . 
ii . » 
O t . 
: Pe 
md TAS 


k » 
w 
= . ' e 
Mimi .. 
AD ams lis dă 
i 91 WE 
. . ' 
Pe) 
a .. 


„5,2. Tabelul de O A TEE o la 
între două caracteristici deet psti 


i "sai, Crearea unui tabel de contingenti? TEREN 


Tabelele de obstea sunt tabele doăătităite din numere întregi, l 
descriind repartiția elementelor unei mulțimi în funcţie de dgis serii de 
pariat hire de Toreo se construieso piesa va la mri 
x elernon. f y. 


it Fie v un tabel elementar care s descrie fietare + cuca al 3 
E a Albeni (eu A 
20.000 de locuitori) . f 
a funcţie de cartierul Ne. / Nume 
unde: locuieşte, | po | 


` respectiv variabila pa ză mea A... 
ee reia -modalități ` 2.5 Ghaffar M: ` | 
(A, Pr o AI 


y Morilor-M.. o NE 
"cartierul Papura-P, Xx 
== Cartierul Neagra- 
be a ACT +» 
“Tăbacărie-T) a 
ANA dd pu 
naţionalitate, 
respectiv variabila Y, . 
o RER două „modalităţi 
(Ye . localnic-LOC, > 
ŞI Y, = străin-STR). | i ne | 
În tei, SNE, la o modalitate este notată cu ti iar non- apartenenţa cu 


m o -ort 


aw ce neamt 


' Studiul tabelului de contingenţă se posie séptica: si în dacii caracteristiciior consi, cu A 
ea sat e ca acestea să fic dina, ag OXG; ua să fie iau d în clase). 


a el J PRN Teze i cl 


“De fa acest tabel elementar se poate' crea tabelui de contingenfá, prin 
' fas umarea numărului de cetăţeni care îndeplinesc simultan ambele modalităţi. pr 
De exemplu, existá cel puțin un individ (onescu), care locuieşte în cartierul. 


| de Morilor si este localnic (îndeplineşte modalitățile X, si. Y), în schimb există 


cel puţin doi indivizi (Ghaffar şi Zhu) cate locuiesc în cartierul Neagra şi 
-: sunt străini (îndeplinesc amândoi modalităţile X; si Y). După ¿ gruparea tuturor 
> “celor.20, „000. de locuitori, se efectuează suma tuturor coloanelor şi a tuturor 
a im: sis se a re, următorul răi d „care este tabelul de grea esti 


a Ea see dlls pi 
| + are Tea —+ 4,000 

TE A (Neagra) zi 

A E X (Taiere) 


| pa o mai i bună lege s a analizei efectuate, reco mai jos | 
A: schema n unui tabel de contingentá. . . 
ES Notaţiile unui tabel de coatingetț, e cu care > ne vom natos si in alte 
lo, capitole, sunt următoarele Eesi, PAF | | d 


E * i- - desemnează liniile (au module c caracterului T 
O LE - desemnează numéral total de linii; ci a ZA „e 
aj. desenează coloanele (em modalaio caracterului da sI, } : | 
"p- emos, cumiral total de coloane; | de pa Lage ra pas 
* go decidas clica ce aflată la intersecția | liniei i cu coloana j r 
| Y exemplu numărul pa iai care e locuiesc în Lente i şi au l paeme w 


danedd efectivul ca abată la intere: ultimei tinii a cu à 
altita coloană P); za. 4 


Mid 
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timp modalitatea Y și 7 mod APCD et 


„.. caracterului + d “Punctul a ka E EAN Ey pi. h 
înseamnă că respectivul CAN 
caracter pus în coloană | Ea fa Ea] do o ai BAC 
„este considerat în Paie perno TES 


efective ki, kjp «+ « ku e 


ȘI distribuţia condiţională | 
a ilw X dacă Y, este 


~ sondiționalà: a lui X 
pentru niodalitatea! Y, 


Pentru un j fixat, 
„efectivul său total este 


| n k, & punct ) - desemnează efectivul total al Aa J> adică 


EA Apă edi ! i 


ina (respectiv numărul cetățenilor « de naionalitato j). Bfectivul ko; esto efectivul 


care posedă în acelaşi 


diferitele modalităţi ele iu 


totalitatea. sa. Diferitele . l 


-k j formează 
realizat sau distribuția. 


ceea ce se notează iia 


XI, = K, EE ka. ty ko -Èr 


Există dai p distribui condifionale he lui X (p Siar Valorile ultimei 


„linii (Key, Kos e ee Rapp + e k) formează distribuţia mega a 
caracterului Y în de al de caracterul X; 


: A be "k, (k; Ae y desemnează efectivul total al liniei i, Toi 


D 


E | f | UR numărul cetăţenilor ds cria i). Efectivul k;. este ciclul care 
sl aia în magein TR modalitatea X, şi diferitele modalităţi ale cäracteñului 


dar 


i 0 "În cazul în care variabilele au fost discretizate în clase, Y, este centrul clasei j. 


pe 


ip “puietul Sici că Á laa caracter pus sin linie este y doniran 4 în 


e totalitatea sa, Diferitele efective kyj, Las » + + kyy ++ « kẹ formează distribuția 


-condifionalá a lui Y dacă X; este realizat sau distribuia conditionalá a lui 
+ Y pentru modalitatea” pin ceea ce notează tit Fontu un i fixat, efectivul său 
+. total este: si lg | 


Y, per pi că eto -$r 


| Există deci | n distribui condiționale ale lui Y A linii). Nalorile ultime: 
“coloane (ki, krs . . ko... ko) formeazá Seinibupia marginală ; a 
caracterului X în funcţie de caracterul Y; 


d k.. hi PR punct) - desemnează efectivul total al tabelului, adicá: 


=y Fk = =k (respectiv numărul total al cetăţenilor din Albeni). 
ini jal 


| De exemplu, î în tabelul de contingentá cu situaţia cetăţenilor oraşului 
e că, „Pl kai = 3.000, k., = 6.000, i Pta ve. k. Mitea 


- Un tabel este un tabel de contingentá dacá suma coloanelor si suma 
pre au sens. De „exemplu, însumarea temperaturilor medii care 
caracterizează cele patru cartiere ale Albenilor nu ar avea sens, iar tabelul 
care le-ar cuprinde nu ar putea fi un tabel de si Un SERI de 

contingenţă este definit de trei parametri: - 
* - unităţile AN de numărat i cazul nostru cetăţenii din 
Albeni); 
F- - două caractere (variabile) d discrete care eii stat dlvâieasilite 
- (în cazul nostru A la unul dintre cartiere şi naționalitatea). 


AZ: 2. Analiza unui tabel de contingentá 


y tabel de contingenfi, liniile şi coliiatiel joacă roluri RPR 
simetrice. Acest lucru (respectiv posibilitatea transformării coloanelor în linii 
şi invers) nu trebuie uitat, deşi, din comoditate, în analiza unui tabel de 


' În cazul în care variabilele au fost discretizate în clase, X, este centrul clasei î. 
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ELA contiagență: se s foloseşte pentru linii termenul dă. de cazuri sau indivizi? lar 
PAE coloane cel de variabile (Sanders, 1989). l | 
|.» Rolul analizei unui tabel de poca este acela de a s stabili dacă 
fii pi variabilele considerate există o legătură. oarecare, dacă între unităţile, 
A. t „ spațiale descrise de aceste variabile există asemănări sau deosebiri, ete. 


“Pentru a putea efectua analiza şi a compara liniile sau Si dandii 


mo de „contingenţă e este. necesară realizarea profilelor? liniilor şi 


a $ coloanelor. . TE z e: ze Al eS i y 


is 2 2, 1 Stabilirea a profilelor liniilor 


ie ea 


„al: liniei- respective. [N 


| Aba, este ipogea: 


AN Astfel se obține | 
„. partea relativă a coloanei. [| 
gA cj în. linia i (adică partea | Morilor : |. 
E NU) relativă a M cetăţenilor e AIE LN 
Re cartiéralid Care au. | 
„cetățenia: F Suma | 
fiecărei + linii  astfel - | 


“(sau 100, dacă - | TOTA 


Laa a se - «face... I a tăi 


“procentual, | 

i Aia j/k; .) Xx 100) (vezi. tabelul. 1 alăturat). | | 
RR -: Analiza tabelului profilurilor liniilor permite deja câteva consideraţii 
AN e la relaţia stabilită între cele două variabile şi la diferentierile. 


| de „induse de acestea între cele patru cartiere. Astfel, este vizibil faptul că i0 
t, Albeni A sunt t30% străini se că în cartierul, Tăbăcărie a sunt pcia | 


ON 


i Aj Aceasta deoarece 1 în geografie, liniile u unui tabel de contingent sunt teis unitäți spaţiale | 
E da în cazul nostru cartierele oraşului fictiv Albeni). În statis stică, prin individ se mo 0. 
Nba pm adică unul dintre elementele matii caracterizat den vanaBilele alese. - 


AR apte “ Profilul u unei ilini: se obţine prin impartirea efectivului fiecărei căsuțe 
a liniei la efectivul total 


a | 
“>Brofilui u unei i lini s sau jatu unei Piae Dogi reetivizares valorii din fiecare isu a! a oi A 


a: e a sa la totatut liniei A (epiese, 


(60% din ‘populația cartierului). Relația abia sesizată. este incompicia, — 
_ deoarece lipsesc informaţii referitoare la raportarea fiecărei unităţi spaţiale la 
totalul populaţiei oraşului. Această. lacuná poate fi acoperită prin repetarea. 
operaţiei de relativizare 2 + modalităţilor, de această dată în plan vertjçäl A 
i (pentru coloane). | 


34 2. 20 $. Stabilirea profilelor coloanelor ` 


| profilul unei coloane s se obţine! prin imprțirea efectivului fiecărei i 
“căsuțe a ' coloanei la kE 
efectivul total al coloanei. [PT 
respective (k;/k; sau 
(k¿/K.) X100). Se obţine” | 
t astfel partea relativă a | 
“liniei i în coloana j | 
(adică partea relativă i ih 
cetăţenilor . de. 
naţionalitate j din 
„cartierul i în raport a” 
„oraşul . întreg). (vezi . 
„tabelul alăturat). patat 
nl Dag De această dată, y | 
analiza. tabelului profilelor coloanelor Ei situarea fiecărui carti în 
„cadrul oraşului în funcție de cele două variabile care îl caracterizează. Astfel, 
: se evidenţiază faptul că în cartierul “Tăbăcărie jocuieşte 25 % din populaţia E 
3 'oraşului, însă aici este. concentrată cea mai mare parte din populaţia de 


5 ongine străină (50 %) a cea mai mică parte. dintre localnici (14 "do 


y yy 3. „Stabilirea existentei / n 
două caracteristici 


A ET ES . 


on-existentei unei leg ături, între cele 


ho mai i SE ou cale de a sesiza existența / non-existenfa unei 
4 legături între cele două variabile este compararea distribuţiei frecvenţelor lor 
„teoretice cu distribuţia. frecvenţelor observate. Deoarece.. tabelul de 
` contingentá este de fapt tabelul distribuţiei frecvenţelor. observate, putem. 
construi, plecând de la ultima sa linie şi de la ultima ša coloană, tabelul de 
conos Pes P tabelul de  contingenţă a frecvenţelor teoretice). 
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$ A ora pat a unei imei oarecare sl) este dat rr a pi 


s diii efectivul total diant cu patina de a lua dl itátes i i AS 
na cu pita de: a Moral modalitatea, $ Simplificată prin ko. relaţia devine: 


¿EX 


E $ aa 
„De e ezemplu, numărul teoretic cal străinilor din cartierul Tabäcärie | 


= a 


dla distribuţia 
== teoretică. şi distribuţia | 
< observată (efectuată de | 
“obicei „prin efectuarea 


ii i 6000 5000/2000 . ii iure cana 
„1.30000000/20000 ` A a a 
111500. Prin | urmare, | 
“tabelul de: -continigentá Mori 
teoretică ` „este. „cel. prea 
TE alăturat, e 


E T 


| : Tăbăcărie Îi 


“.. diferenței - ‘dintre - cele. paci aie moir T 
= două distribuții) permite stabilirea faptului existente « sau u non-exisenei unei 
fo mero, între cele două caracteristici X si Y. > | | 


iute - dacă distribuţia observată este confor ná cu distribuţia teoretică, nu E 


în există ni nici o legătură între cele două caracteristici; . 


„= dacă distribuţia observată diferă în mod semnificativ « de draj | 


„. teoretică, există o legătură între caracteristicile analizate. 


„Comparând, distribuţia observată a cetăţenilor miel Albeni. şi SI 


E A lor teoretică, se observă că acestea diferă evident, deci între 


iar nl de reşedinţă şi naționalitatea cetăţenilor există o. oarecare legătură. PS. 


„Prin această metodă s-a putut demonstra doar că între caracteristicile 


A şi Y există o oarecare legătură, dar nu s-a demonstrat că există şi o relaţie, | 


$i „care, : să ne amintim, implică şi dependenţă (statistică sau matematică)... 


„Două caracteristici sunt independente atunci când nu există nici o ; i 


hui între ele. Independenţa lor:este ari atunci când Ea e e ali 


i ERIE oarecare a poen. ete nulă, adică | 


Se HR ¿A 


BA AAA e a 
[me ama CĂ " Da . 
d ai AA SEY a 
ENR +, . . 
a Í e SE 
98. “ip za 

ie D HOEN 

ae Pe O, Ey . 
` 


a he Xkoy =0 . 


pp 


Această situaţie setate la Ay cazuri: fe actis i care ¡efrctivele suat i 


A ' idoni |! în toate cásujele, fie acela î în care els sunt dispuse PP: o linie sau 
„pe-o coloană (fig. NA 


Ta aceste cazuri, diagrámele de iute corespunzătoare sunt K AV Fora | 


unui nor fără formă determinată, fie sub forma unei linii paralele. cu axa oX 
=> (independi entá faţă de Y) sau cu axa oY (independentá față de X). Caractereld 
se află astfel în independență matematică (Calot,1973). Conform acestui 


DN principiu, se poate vorbi şi de independenţă statistică, care apare atunci câni 
b As variazá independent una de cealaltă (fig.5. 2) 

| Situaţia opusă (caracterele sunt perfect dependente). se. giu 
e, taci. când o funcţie matematică Y = f(X) leagă în. mod riguros variabilele 
care astfel se aftă în relatie functionalá. Coudifiile 

3 ` îndeplinite doar atunci când unei modalități Y, îi core 

-o numai una (adică, în tabelul de contingenți doar o singură căsuță pe linie 
e și doar O singură căsuţă pe coloană are un. efectiv non-nul (fig.5.3). | 


„Este evident faptul că cele două situaţii limită (independenţa 
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Bey DICA "aa: 
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N 
y 


le acestei situații suni 
o modalitate X, | 


Tiai 
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Figura sa: Tip de tabel de jr felină care pi Fe seed lise A si ias 


de me i aferente mit de det: di matematică (după Chadule, 1974). 


INDEPENDENTA MATEMATICA | 
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ie iin A 
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gara. 52: Tip de tabel de contingență « care ilustreazá PAA stas și diagrame d de 
ne aferenie cio de. E at sn o e ia 
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INDEPENDENTA STATISTICA | 


gara 53: pc il de de i dietă sein Animais gpro ó meta 
aja A ae: de did aferente sti de relee frames € (după $ Chadule, 
$ AS a a e eii na le EA al — i, e ESEI 


TGA TURA FUNCTIONALA LEGATURA FUNCTIONALA zii fe aici EA 
de miam alibi Ela ÎN 


A cau MATEMATICA) N 
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„Mara. sa: En x A de Pi ace oare PERIE dependerá: starisict 20 diagrame d de 


i = lapar ofereme gaură de iei l statistică ge sa Chadule, 1974): 


maniac Toa . g sili ` apă i A E ai i .. în fata a 
¿AA ROEA) _ 


Ñ - Depend a ak ‘statistică ponie f pie a mediese sau i slabă, i: de 
| rană x find Ta vnelo cg grea d ep Biel de pura aa za e scaniănă destul “AI 
: i mult cu independența; E {i A Lui i dată act e 


RE AS 


de indapendeiyA, cărora. ţi să: ponia: EN ua a prag de înc sd ler pl (au prag pă 
Si decizie sau prag de eroare): cunoscut. . TR ra aa i 
„cd Cel mai adecvat test este. testul de independenți: şi de de le 
va pátrat)!. Acest test are ca bazá compararea distribuţiei efectivelor observate. 
-. (k) din fiecare căsuță ij-a tabelului de contingenţă observată cu efectivele 

k teoretice (Ey din fiecare n. Ya a tabelului de O u teoretică, m 


“tot restul tabelului, Cu toate acestea, c 


- mot eza independenței maternatice, RM nod a SM PEEN 
„ui... "Pentru aceasta, se calculează în primal d când efectivul teoretic zo 
i pe ea care a l-ar. avea a fiecare e Si e în cazal. E a matematico: h 
A Sa n apa Re Xa, Xk ds 
| ka Sonim E se e tunat A diferentelo d a e efectivele teoretico si efectivele A 
i A a statistica D: a A cala a având pa Ea i Pe e pe aa i 
jaa ela EN i ia Da ¿ERA En RER, D Eau 
| i a de: A s del Jal e i â 

tai enel o old de separtiio xo cuy grade de libertate, i iar > = -DeD ) fia 
ia “numărul de clase oae ale A: X des e - numărul € de căii 
E ¡olaa ale caracterului T | | 


"¡ANT După aiia acestor ; calculo, | se isean ipoteza nulă a, A 
_“ conform cáreia.X şi Y sunt independente „ Caracteristicile sunt independente. 
„doar dacă se îndeplineşte condiția D = € {C este valoarea; citită în tabelul - 

"distribuţiei y? prezentat în Anexa VI; citirea sa se face: exclusiv în funcţie de. 

y — deci de numărul de grade de libertate, şi de a, adică de pragul de 
încredere pe care îl alegem]. Pentru ca această metodă să fie valabilă, trebuie 
ca efectivul claselor cd AN să fie od sau denia lui 3 k 

oa e: >: An | | Sot, 


“lor, ¿petita tn mii de tocuitori: qe 
AUE Din analiza celui de ccosiogen. das Dr e cell i 
„+ doar'o singură căsuță are efectiv mul (YX) iar efectivele sunt distribuite în ` 
re o nu se află în relație de 


keti independenţă mätematică, deoarece contingenta nu este nulă (de ex. PX 


FX, = +1,5).: Este necesar deci ca să pornim de la ipoteza nulă Ho 
„conform. căreia nü există dependenţă . între “locul de de: regedinfă q 
„Maționalitatea cetăţenilor din Albeni. ; 
ia “Deoarece am făcut ipoteza ` de independenţă iaon, vom | 
i “ considera de asemenea tabelul de contingenfá teoretică (care va fi utilizat la i 
P Sres santier es | > necesare anor. ai lui D. 


a E “Pentru s a: sintetiza demonstraţia; vom utiliza un singur t tabel care va. y 
cuprinde, toste: «cele: trei serii de valori; ponte srl Seine Ey | 
ENE: PR notate în tabelul « den mai eo cu e: A 


ai p en Er T A a E „te AEA A RENE 
calcularea valorilor celor ,. e i Pl Pe de [la Pa. d 
alăturat, ` 1 va ‘exempla | 52, dj? ; 
numeric: poate. facilita - ly: pp. d! 
fujalegares. “Pentru [= 

isuta Xh Valoarea . + 

-ebfecival observat at este, lka; k.i 
i efectul 2 teoretic c este ARS y te sar E a Ea ea 


D= - 0,6449, 07+1,07+0 64+1.50+04 17+0 1741.30. sim 
; = da i $ A 34 e de libe r. i | | iz 
a cad, (pragul de pre 


za nulă tar iba că i variabilele 


ile fie mai mare sau egal cu C. În exemplul nostru 
74 A D <c (4, 76 <. 7,80, deci trebuie să refuzím 
i -de independe de bordes perder ca te 
ele e totu maj de dep. A SEE 


tt Lc e ta fin ră a iabelului de comingen poslo sugere PON 
ise unei legături între caracterele studiate. Testul x? permite sesizarea 
existenţei, relafiei. de dependenţă. Nici una dintre metode nu oferă însă 
informaţii așupra intensității şi sensului acestei relaţii. Pentru a avea aceste 
isiformafii este nevoie să se calculeze raporturi şi coeficienţi de corelaţie sau . 
de asociem.. La aceste misini. vom eS. PAR, intermediul pf templelor A 


ti 


ee că, pentru. ca relația de independenţă $ 


5.3. Măsurarea relafiel dintre două caracteristici cantitative 


“variază împreună 


"Urmare, & măsura 


* altei distribuții (Chapot, Dauphiné, 1977). Altfel spus, másurarea corelaţiei 


„dintre cele două distribuții atunci când valorile celeilalte suferă o modificare 


ari ` - suprapunerea hárfilor tematices +. ZA k i 
o zi = analiza diagramelor de distribuţie, 0 d 


"a Suprapunerea hărților (sau metoda cartografică) este metoda 
.. specifică geografiei clasice. Unui meteorolog i se va părea firesc să studieze 
_ variaţia simultană a altitudinii şi-a temperaturii. Pentni a măsura relaţia dintre“ 


„ aceste două variabile, cea mai simplă metodă va fi aceea de a suprapune o 


ha artă a izereele p peste u una Li  izohigeole r tegiwi ; i analizate, Baiat. toate 
cur cei al izobijselor, | 
incât, stodiind € dinamica, parey a parem te eric şi al. celui i li 

„cercetătorul să ajungă ! la conciuzia că între temperati Ro 
există” 0. relaţie - invers. ‘propor ţionată:. pe: măsură ce pralea regio, 1 
A Atura: scade.. Rezultatele acestei : „metode. sunt „modeste, sémánánd | la. * 
*nivelul: discu 7 í iyi imprecis, calitativ:. cercetătorul - a: stabilit Că, există 0. 
“legătură între cele două variabile, că legătura este de dependenţă şi că sensul 
acesteia este. negativ. Metoda nu poate. spune cât de intensă este, aclafía, încât W 
“aceasta. nu. poate, fu comparată ca alte relații sesizate în regiunea respectivă. 
ha plus, cercetătorul nu vá fi niciodată sigur că relaţia sa este semnificat! WA ; 
„sau că zu } reflect de hnt. o situatie. e exceptionals, accidentală. F. 


ză 
“g 
PEN 


dis pamelor de s distribuție i aficului de corela istic 
„metoda: “care “face e ES A o mu WI rin 
Y Y - de. da “analiza. TIA 
- hártilor suprapuse la ces Îi A | 
“statistică. -Metoda |. 
„consistă în. a trece în: | 
< planul unui sistem de axe 
-rectangulare (grafic 3 
cartezian) - punctele: o 
cei tes pu u az ză t oar re ; - Y 


Să lo) relaţie este liniară dacă norul de puncte predni o O formă A alungită cd o | 


„direcţie -. „dominantă ` 


"complexă, curbată f 


Edy. iperbolică-| 


Rua: eto. 


—(fig.S. 5); relaţia este deci = 
"liniară dacă forma | 3: 
- norului. poate fi ajustată | -- 
„corect. cu ajutorul! unei fo 
“drepte, adică dacă. se | .%| > 
„ poate găsi o: relaţie între |% a 
X şi Y care să aibă [4 | 
forma Y'=aX +b..|* | 
Tn fig.5.5 relaţia între X | 
“şi Y este liniară; punctele. | 
se grupează pe o direcţie | | Ai AR tă 
“anume, fapt care conferă | * EE DB D 
| unan ey e A im 


| | hi ra 5.6. ăi norului de pinte în cazul 4 

0 elii este non- relaţiei nbliniaţă dintre două variabile. 

~ liniară dacă norul de. . -. | | 
- puncte prezintă o formă 


-(fig.5.6); . relaţia este | or 
$ non-liniară dacă. relația | 
- dintre X şi Y nu este de. | 


i „de. tip. diferit: parabolică 
< (Y= a+bX+cX?), | 


| „variabila Y. o A 


UPS 1/(a+ bă) 
| „exponențială pa), |. 


Ín fig. 5. 6 relaţia dintre X A da A 
"şi Y nu este liniară; deşi | dd | et | 
norul este alungit, acesta Figura 5. 7. Raporturile de márime dinire cele j 


ri îşi schimbă. „direcţia „două variabile în SER relației pozitive. 


variabila x. 


$ eul w 


“Sensul relaţiei « este indicat de orientarea direcţiei principale de 


pna a ai i în Ten cu axe eie Copr ona jr le 


E ES o pa ip cale. > cozitivă pita cele două y arabile variază în, , acelaşi sens, 
adică dacă se observă că: ci Arata $ | fs 4 

No Cn - valorilor mari ale variabilei x le ecorespind în general valorile mări | 

e acabllal Le asa i i E 

| mă valorilor. ai ale variabilei E le corespund în general Valorile 
medii ale variabilei Y; w aee 
E A - valorilor mici ale variabilei x le corespund î în «general valorile mici: 
ale variabilei Y. rA l; | NN | K 
E idea Generalizând pentru două unităţi i şi j ale distribuţiei, se ‘spune că. 
relația este. pozitivă dacă se observă că, dacă i ta atunci este probabil, ca” 
de Y,>!; (fig. 5.7): A 
/ În fig.S.7 relaţia dintre X si Y este e pozitivă, deoarece valorile lui Y de 
„variază i în acelaşi sens ca 
- şi valorile lui X. 


` * O relaţie este negativă 
$ dacă cele două variabile | . | „YA. ue 
„ variază în sens invers. | |o N ae ge ali 
| adică dacă se observă că: N No N i 
he sint valorilor mari 
“ale variabilei X le - 
„corespund în „general + 
„valorile. mici. ale 
„variabilei Y, EA 
Fa B - valorilor medii d iC 
sale “variabilei X ste iau d | 
DE corespund... în general Fa 5,8. a er PT mărime. dintre cele 
valorile „medii “ale AONA, variabile î în A ad ti E et 
` variabilei Y; - idas E AS A Y 
- valorii. mici iale variabilei x le corespund i în general valorile o mari 
„ale variabilei Y.. a É 
| | Generalizând pentru paie unităţi i şi ale ELO i se spune că 
relaţia este negativă (sau pi Are dacă se cecul că, dacă de > An atunci este 
probabil ca Y,< Y, (fig.5.8). | | 


y „În fig.5. 3 sean e dintre x şi y este negativi, deoarece valorile 1 lui Y | 


i 


æ. A -ooreen oee on... |. : ooa í 


2. 


„variabila Y ; 


di aN 


o 


l variază î în sens invers s variației Valorilor hi X 


h O rajas is o nulă dacă pt două A variable s sunt total independente una ya faj 
_ de alta, adică dacă se observă că: 200 | 
| - valorilor mari ale variabilei x ele e corespund valori mari, medii sau | 
mici ale variabilei Pe. 0 ii NZ | 
| - valorilor medii ale variabile x le corespund v valori n mari, medii sau | 
y E mici ale variabilei Y; AA LAE 
„= Valorilor y E Fai 
ale variabilei ¿dé 
corespund valori mari, 4 
medii sau mici ale A 
variabilei Y (fig. 59). 
e  Generalizând, se. -. 
fa spune că o relație este i 
nulă dacă faptul că se ` 
cunoaşte că X>% nu | | 
- permite să se prevadă m PAS 
LA > sau că Vp pai 
E „În fig.5.9 relația z 
T dintre X şi Y este nulă, E 
E de oarece var iația Tigua 5.9. Raporturi de mărime act între | 


valorilor lui Y este. cele sai e pi în oksil, relaţiei . pum. 


Di 
a 
Q. 
E 
s 
> 


SH AN variabila X 


—indiférentá la pariaţi NES 
LA Malaia | lui Xx y 


El. "intensitates alai e este bar de modul de grupare pe grafica i 
S de cortita a valorilor yy i în Aia de valorile daci 


(e o ratati este 5 puternică dacă unităţile c care au valoii vecine pe X au de 
- asemenea valori vecine pe. Y sida in care. e. norului î îi dau acestuia A, 
„. Aspect compact). iy 
- Generalizánd, se spune că o relaţiei este puternică dacă faptul că X este 


A Pe de X, implică faptul că Y, este aproape de Y. 


sb "În fig.5.10 relaţia dintre X şi Y este puternică, deoarece punctele sunt 
E- apropiate unele « de altele, , ceea. ce Aiei yurila în în paralel a valorilor 


O relaţie este slabă | «ol 
“dacă unităţile care au |. | 
„valori vecine pe X pot. | 

"avea valori îndepărtate 3 

pe Y (caz în care | 

„punctele norului îi dau | 

acestuia un aspect 

< rarefiat), Generalizánd,. 
„se spune că o relaţie este. | | XY e dl 
„slabă dacă faptul că X | pă A: de | | 

5 A pg E. - Figura 5.10, Relaţie strânsă între două variabile. 

-aproape de Y. > o 00000 yA iini a 

pi -Ín fig.5.11 relaţia dintre X şi Y este slabă, deoarece punctele sunt 

„îndepărtate unele de altele, ceea ce semnifică non-paralelismul variaţiei. 

-valorilor vecine pe X gi pe Y. | s iia | 


m ASYE IX : 


—wariadila Y 


| LE, Aen eme patente n 


ai lira o N 
pe d i 200 p Ene N i 
3$ ` : 


$ 


variabila X 


„Dinceleexpuse, | oT ea 
„se observă că analiza | 31 FP A E Ml NE a 3 
grafică este mai precisă | yb... 03 0. axi =3, Y2-Y1=8 || 
decât analiza: [Uso Faza Yavzess | 
„cartografică, oferind A A | 
informaţii mai detaliate ER: si 
; asupra existenfei/ non- y i | ai xi ici de Xj au implica. 
- existenfei relaţiei, asupra | O: za SR A | 
formei, sensului şi | so e HU eo 
“intensității acesteia. Cu | | YA at 
„toate acestea, rămânem | 5 3 5 5233 
încă : ha “nivelul . did ARO E a at A E 
discursului calitativ, Figura 5.11. Relagie slabă între două variabile. 
deoarece nici prin. . O zane 
analiza grafică nu se obțin măsuri precise pentru intensitatea sau pentru . 
- semnificativitatea relaţiei evidenţiate, iar informaţiile obţinute nu pot servi 
„pentru efectuarea comparafiilor cu alte relaţii existente în spaţiul analizat. 


La 


“ yariabila Y ds 


35 40 45 50 


| | 10 | 


dd tai * Analiza statistică, à una litro o kto geografiei bierne. poste J 
să scoale lacunele celor două metode precedente. Trebuie să. remarcăm că. 
ipotezele analizei statistice pot să aibă ca punct de plecare ipotezele sugerate | 
„de primele două metode. Principalele tehnici ale analizei statistice sunt 
„corelaţia şi regresia, cu ajutorul cărora se obţin toţi parametrii necesari 
3 pi hai proce a Teor greru şi itp bangas za ele, 


53, L Coeficienții de corelaţie 


ui pa dintre desk E Dă di este buair de : 
nuda şi de raporturi, care sunt numere- fără dimensiune! şi care sunt. 
folosite în funcţie de natura caracteristicilor şi a relaţiilor. De exemplu: 
- - coeficientul de corelaţie liniară (7) este utilizat în cazul unor caracteristici 
cantitative şi al unor relaţii liniare; | 
îi raportul de corelaţie (y) este utilizat fie în nit a două caracteristici 
“cantitative, fie a unei caracteristici cantitative şi a celeilalte calitative | 
- nominale, în condiţiile în care relaţia poate sá nu fie liniară; 
- coeficientul de corelaţie a rangurilor Spearman (p) se utilizează în cazul © 
Caracteristicilor. calitative ordinale, când condiţia de liniaritate a relaţiei nu 
„este obligatorie; | 
- coeficienţii de asociere măsoară fie. ¿Dperidenta: dise două cerca | 
calitative nominale, fie cea dintre o caracteristică cantitativă şi una a Calina 
nominală, | 
Coeficientil de corelaţie permit obţinerea unei măsuri sintetice a 
sensului si a stepei rn, dintre douá caracteristici. 


"Coeficientul de dias liniará SEARE A permite detectarea 
prezenței sau absenței unei relații liniare dintre două caracteristici cantitative. 
Pentru a calcula acest coeficient, este nevoie „de calcularea covarianfel, 


Adică iodat de unităţile de măsură a variabilelor şi invariante la orice transformare 
liniară a variabilelor cu coeficienţi pe | 


111 


moa da rándul ei av ad da bază calcularea. covariaţiei!, Un “exemplu; 
concret posta. facilita înţelegerea acestor. parametri. În tabelul de mai jos, i. 


“ (populaţia urbană, în procente, | România= 100%) şi de variabila Y (valoarea 


“fiecare dintre cele opt județe ale Moldovei este caracterizat de RE Xx 


gra apilada n în, pedeeate, România = - x100 ms la pivali Min 7 


Sp 


— | SUCE AVA le dee 
A VASLUI. 


y pe VRANCEA | de li 


ua eu = ecarcárilo la ii a ab a cabe Xx E = x3; PONS 
„9 = ecarturile la medie pentru variabila Y ye ie de 

-  x2= variaţia totală a variabilei X; = dl 
Lis y= Variația totală a variabilei a 


| pn i Nai şi sept. y Sat e unei ei distributi s statistice“, Dacă naa o variabilă. se calcula 
y „variaţia şi varianţa,. peniru dotiă variabile se calculează eqricluja şi covarianja, în Same, de 


Be modul cum variabilele variază í usii 


OS -covariatia totală dintre X Să AO gag: a 
Ely T exemplul de mai sus, X şi y it aa cb i judeţ, E 
E respecti startul, fiecărui, Borg am. de media. ansamblului. de județe EE 
“considerat... : ly 
(Trebuie. să pu i faptul. că, IP uit este ji ta E añada y unui d R A 
aport de alte Jocuri, din ic de vedere. al geografiei, acest Taara este H 
meri fi mi variafi ia a spatial... i ah 4 ¿leia 
e noy Pe entri à id obţine baciti a totală. a Feann, dintre BRAN x şi Y, Sil 
“trebuie ca valorile Xx si y. să fie ridicate la. pătrat, deoarece, conform . 
„propri ietăţilor mediei aritmetice, Ex =0 gi Xy =Q. Prin urmare, suma 
“pătratelor e ecarturilor la medie oferá másura variaţiei so, a unei variabile; 
cial Dx? = 4,4 iar Ey? = 10,9. 
da. „Deoarece. trebuie să inisucien gii pl pi două $ arabile, trebuie | 
e cunoaştem variaţia care există între cele două variabile. Suma produselor 
dintre ecarturile la medie ale lui X şi ale lui Y (Exy) este tocmai această | 
| măsură a covariafiei. în spaţiu ale lui X şi ale lui Y. Stiind că varianfa este 
3 media sumei. pătratelor ecarturilor unei variabile, prin. ei se , poate f 
Aoma a rue n hueca ria simultană a două variabile: 
F 
R nE COW ha ie it 0 | 
adicto COV = = 6, E = 0, „162 LINA = rancia jus > = O Bcuafía se 
mai postes soer oii ul be | 


Ea Dor > 
CO ru O K 


ü m adia COV = e, 7. 1, DO" (i, anias 9. 1 et 1. 0500 
y 2 +A ° 0, DICO, 2: ae E i . e os ye a, D l 8 = 0,762 


ja ca: Un Yui -19/801 1 +2, d = 0, 762. 
A Analiza covarianței poate să fie utilă în sesizarea y sensului relației: 
r Dacă COV yy > 0, relația este te ponovi, Aan | 


e Dacă COW, xy „ad ,, relaţia este po 
sE o Dacă 4 COVa = = 0, nigra a este nulă. 


RA: E P E 
A E ie 


ala decât q 
Ín mod 


E ipii repita: lite cata 'se i că ori zu măsoa 
Th iesi unei variabile, depinzând de unitatea de măsură a acesteia 


logic, covarianfa depinde de unităţile de măsură ale celor două variabile, din 


care cauză nu putem compara covariantele distribuţiilor care au ecarturi-tip 
- diferite, Pentru a-se depăşi acest neajuns, â a. fost imaginat coeficientul de 
-2 corelație liniară Bravais-Pearson, care este într-o oarecare măsură 0. 
- standardizare a cla cal ceea ce o “face letal pentru distribuții 
Eos cu ecarturi tip diferite. Ea, 
opa, Coeficientul de corate liniară i) a două hariabilo x si Y este 
egal cu oran, dintre X no Y divizată € cu u produsul ecarturilor ae ale 
Prea pă d a cz E TS aa Bo 
T i COV 


| 5 ah s A iu => ic: = XY adică o, 0,16210, 7 ʻa 12) = = +0, 877. 

` de xi p “Sy . EA a. 
“a Trebuie | să apă “faptul că dä: cele. “două. dais “sunt 
i dar Jizate (X,Y = X”,Y), atunci 0(X') = a(Y, )= 1, încât coeficientul ee 


i e, liniară - pam egal cu aaa celor « două variabile: Per. a 
EE " Coeficientul dă TANE liniară Du dale Ponticn a a) PENN între - a 


E q si. i) si másoará gradul de asociere dintre Y şi X. Cu cât valoarea y 


= coeficientului este mai aproape de -1 sau de +1, cu atât relația dintre cele : 


“două variabile este mai puternică. Dacă ryy=0, se spune că cele două. 


Sd variabile nu sunt corelate; aceasta nu înseamnă că cele două variabile sunt. 

| independente, deoarece între ele poate exista o relaţie non-liniará, imposibil | 

„„.. de detectat cu ajutorul lui ryp jnterpistăieara coeficientului de  corelafio uaga 
SF ne pin urmare relativ simplă: Es 

A - dacă ryy are o valoare apropiată de o > (de exempla -0 o2, +0, 9,012) 


nu există O relație liniară între X şi Y; 


- dacă Fxy are o valoarea apropiată de -1 (de Deol 2, 7 25, 

| 0 ,954), între X si Y existá o puternicá relaţie liniară negativă, | 
W, - dacă rxy are o valoare apropiată de +1 (de exemplu, în cazi 
; jostu, +0,877), între X şi Y există o puternică relație liniară pozitivă. 

Ín concluzie, semnul lui ryy (+. sau -) indică sensul relației (pozitivă sau 
negativă) iar valoarea absolută a lui Tæ yr qe rel» indică intensitate? 
relației pnei, slabă s sau nulă): zh O | 


24 


E ia pari | cazari, „ prezența valib: excepționale poate pecas 
E mă ura a corelație şi şi # conducă la conciuzii eronate, 000 -4 
20 În fig. 5.12 prezența unei valori foarte mari în cömpàratié í cu toate 
A celel alte > fa isifi că intepre tar . În lipsa punctului de coordonate XioYior ra= O 
| -Jnter pretarea coeficientului, de. catetalin liniară, Bravaig-PS garson 
reia să fie-făcută cu -. a iară N i 
< reticenfá, deoarece rpnu | 
„oferă informaţii asupra. | 
“ gradului de semnificaţie q 
- al relaţiei, care depinde 
„într-o egalá măsură şi de 
_mumărul de observaţii `- 
“ (de ` indivizi analizaţi). 
` De exemplu, se doreşte Pe AO a A N 
„“studierea. relației între NE O ti AN ii 
kea e pe unea Spa [e i L, ee e a a 
| pt ud UA 
ră +0, 800 “obținut pe un |: Ye | 
En ji i Sd | 
de pnl hp Da 3, dz Rolul lirio: brida în 
semnificativ, putând ñ rii a pecan dintre două variabile. 


. datorat hazardului; a 
ipin Tag de. +0, 200 obtinut per un m d, de 2000 de persoane 
A) chestionate este foarte semnificativ şi dovedeşte în mod sigur că între cele 
„două. fenomene: există o anumită relaţie, deoarece mărimea eşantionului face 
"Să existe puţine şanse ca relația să fie datorată întâmplării. a P x 
Es "În exemplul numeric de mai sus, rap = +0,877, ceea ce pra 
faptul că există: o relaţie. puternică între rata urbanismului şi volumul 
AE producției industriale, însă talia eşantionului (doar 8 judeţe) induce o oarecare 
„îndoială asupra adevărului exprimat de această valoare. În scopul reducerii 
„la maximum a ince ertitudinii, corelaţia se ceafă cu o altă tehnică statistică, 


A ii anume cu areis.. 


< me + ls 


“ :X10Y10 ` 


$ variabila Y- E SE EA 


A .. . mă iai . "e 
A A e no oe 


20 -5 Ja 
; variabila X 


5 3. 2. . Regresia liniară 


Coeficientul de corelaţie liniară permite detectarea existenței unei 
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+ relaţii liniare între două caracteristici cantitative continue. Este nevoie însă. 
întotdeauna să se verifice. faptul că legătura măsurată de coeficientul to este. 
semnificativă. În acest scop se efectuează următoarele operații: 
iz se aplică, testul de semnificaţie, ţinându-se ı cont de "a şi € de efectivul 
N ipoteza nulă Ho este că ry = 03 00 
„1. sa examinează norul de puncte pentru « a se Verifica dacă aţa nu 
` este influenţată de valori excepționale; —.* 
îi. se verifică dacă ajustarea liniară este cea mai indicată (cea mai bine 
as adaptată) pentru studierea relației dintre X si Y, Pentru aceasta, se pot utiliza 
„două metode simple: fie se > examinează forma norului, fie « se era ui Par cu Vi 
TI iaz. si CU Fiogx,togr 

4) . Dacă se ont că qdo unei i legături liniare î între Xx şi 3 Y estă 
$ valabilă, se poate încerca sá se exprime relaţia dintre cele două caracteristic! 
CU ajutorul unei drepte. în acest moment al analizei, se face 1 în E G 
ii: ipoteză asupra sensului relației: =i. 
Star, - dacă se încearcă exprimarea Jui xi în fune de y, ecu dreptei g 
den regresie liniară va fi de forma X=4Y+b; b 

ini - dacă se încearcă exprimarea lui YA în funcio de X, ecuaţia dreptei 
8 de. regresie liniară va fide forma Y=aX+b; | 
já dacă mu se face nici o ipotezá de dependență, « se va. căuta: doai Aa. 
` fezumarés cât mài exact a ire se Între X d Y Pnn intermediul ı unei de erd de 
` tipul aă+ a,Y+b=0.. Wr eA 
0 Este foarte importantă precizarea: ipotezei făcute, Fiat dle n a 
să, dtepte: sunt în general diferite: ele nu se supr-pun în planul coordonatelor. 
„carteziene decât î în cazut existenţei. unei legături perfecte între X si Y, adică 
= atunci când Far este egal cu +1 sau cu -1. În cadrul prezentei lucrări ne vom 
limita doar la primele două cazuri, respectiv la cele care încearcă să exprime "T 
> o variabilă (numită dependentă, explicată, sau ESRD, în pei de o aa Ta 
„(numită siana oy finen eai» sau u regresar): | oE. 


iy i spre pred s oreli care i esti „0. inetodK $ gintistică c ce cateii | 
i sio caracterizada situaţia de dependență dintre două distribuții numerice prin * 
| intermediul unei mărimi referitoare la gradul lor: de dependenţă”, regresia 
„este „o metodă statistică ce defineşte o corespondență funcţională de forma. 
a 1100, în incercánd ne ea tai în mod pes opi fi care a, a cele două 


i .. - . Ai 


isteibugi Xi şi p (Chapot, Dauphin, 1977). - | S 
1 Atumci când se studiază relațiile ponibile. pa wae între a 
distribuții din perspectiva evoluției simultanea valorilor celor două distribuții, i 
se încearcă de fapt definirea funcției care uneşte, respectivele distribuții. 
„Aceasta înseamnă că a. studia pe Y ca pe o oarecare funcţie a lus X înseamnă 
a descrie cum anume Y covariază cu X. Astfel, temperatura variază î în functie 
de altitudine, numărul de navetişti variază în funcţie de distanţa până la 
„centrul urban atractor, numărul de unităţi “comerciale urbane variază în 
| funcţie de numărul il poetas d devi râurilor variază î în fue de lungimea n 
„lor, ei iei | 
i “Se abai, prin: urmare că: fololires. di soplésiel permite. 
` cercetătorului să. facă. „preziceri” asupra evoluţiei comportamentului unui 
| fenomen (a variabilei de explicat sau a variabilei-„efect”) 1 în funcţie de altul 
(de variabila explicativă sau de variabila-"cauzá"). Trebuie să amintim faptul 
h că a acorda mai mult uneia dintre cele două variabile decât celeilalte 
calificativul de „cauză” sau. de efect” 4 trebuie să se bazeze pe un raţionament 
„logic. bine argumentat sau pe O solidă structură teoretică. În plus, 
` „cauzalitatea” stabilită prin intermediul regresiei trebuie privită de foarte 
aproape, deoarece. universul în care trăim este mai degrabă probabilist decát 
-determinist. Din această cauză, nå prezice” prin intermediul regresiei trebuie 
„să fie înţeles ca „a stabili, sau a ago tendințe; generale” ale evoluţiei | 
i. variabilei de explicat. d 
| A vorbi de Variabilf=efeót: si yde variabilă-cauză implică a , accepta , 
existența unei posibilităţi de a explica” relaţia stabilită între cele două 
4 distribuții. De aici rezultă diferența esențială dintre corelație- şi regresie: 
pentru a măsura. intensitatea: relaţiei dintre. două distribuții se utilizează 
f i d pai a explica: această 5 alie se prae regresia. i 


$ 3,9, 2, Modelul reg iei liniare A a i 


 Regresia este. un mios de dida: a factorilor y explicaiv, adică de | 
şi np a unui model cu putere de predicfie, care permite în plus, prin 
“analiza reziduurilor rezultate, studierea detaliată a cazurilor ce care nu sunt pi: | 
»explicate” de factorii explicativi « consideraţi. 
hi Modelul general de bază al regresiei liniare este aditiv şi defineşte y 
| o legătură funcţională: Y=aX+b. Deoarece s-a demonstrat în paginile 
AES rioare stie dul că în domeniul d de studiu al 2. legăturile funcţionale 


snt foarte. Tate, dacă 1 nu i inexistente. ‘moäehi tzibute; PS pe pentru a. 
ilustra o relaţie de dependenţă statistică, Astfel, modelul aditiv funcţional. a 
sand Y= aX+b+e, unde cantitatea € defineste reziduurile regresiji.. E E 
rii La fig. 5.13 sunt prezentate trei aaa de sli 0 de tipi e 40) e 
- Dostraid. nisi pă, A $. 
respective” descriu- 
i legături funcţionale, este 

perfect. posibil să 

„prezicem valoarea lui Y | 
„pentru. oricare dintre | 
„valorile “luate de X. | 
Astfel, pentru funcţia 
ou BE =0, 5X, fiecare creştere 
cu o unitate a valorilor 
mi X va om sai o 
a pi sită cu 0, 5 i Mer 
E corespemdénte: i dacă ON E a i 
oa di og u nei “Figura 3 3. B Ti ipuri de funcţii liniare apă 
< Y=0, 5» 42. Pentru Jalineron (SUE Aus 1 spa sii 


a 
EA . 
2 
, 
T 
> 


USERS ma 


E Creer cu o iioii a | 
“valorilor. lui X va | 
i conduce la o eieiei cu 
_2' a “valorilor ES [i 
A corespondente: dacă. 
X=4, atunci Y=2- 4=8; 
dacă .. X= 250, a J 
Y=2: 250= =500. 


+ verol Y A o 


| Geografía este 

însă 6 obligată să studieze - 

„fenomene - A) căror | arian 

reteta A ti i ird | Fans 5. 14. Relația dili x; şi Y nu d paie 

dispersie având ün aspect descrisă cu precizie în lipsa unei analize a 
asemănător „celui din tendinței cli de evoluţie. 


x. Faas ză variabila x. 


îi g 


„ libertatea de: a se | 


525 5.14. Poia: cu o Sine a ta xY de pe Clero care ar Fiai să 
< UŞureze . interpretarea. relaţiei. dintre cele două distribuții, nu are nici pe. 

departe această utilitate: în figura respectivă nu se poate sesiza nici O 

- continuitate şi nici o tendinţă generală a evoluţiei valorilor distribuţiilor $ 
| studiate. Cu toate aceste, intuiţia umană Erne ipoteza existenței unei gaani fa 
- între variabilele considerate. 

Pentru a sesiza această relaţie trebuie da "iti variabilelor să fie privită de | 

„la o oarecare dis stantá, ignoránd detaliile care îngreunează analiza. Cu alte 

cuvinte, este nevoie de ajustarea n mulțimii de puncte XY în funcție de tendinţa gn 

sag generală.. A' ajusta norul de puncte înseamnă de fapt 2 înlocui linia frântă  - 
-din fig.5.15 cu o linie dreaptă care trece cât mai Karad posibil de fiecare 
kont punctele norului. pe ui: 

E O asemenea linie dreaptă este propa, Pa da aceeasi miine de 
„puncte (a, b, c, d, e; f, 
og), în fig:5.15. Este IÓ DE 
„evident că linia dreaptă. |. ST 

trece prin apropierea. | 
majorităţii punctelor dar | 

i destul de. departe de | 
„altele, Acest lucru nu ..| 
„trebuie sá. afecteze i 

cercetătorul, - care are | 


| variabila Y a e, RS 2. 7 o: 


îndepărta. fără: chipul | 
de anumite valori cu Ta 
comportament particular | KU: q 
(valori excepţionale sau- da SAT lea a. É 
valori accidentale), - Figura $, 15, Linia de regresie oferă elementele 
„pentru a descoperi linia „pentru O analiză a tendinței generale; ecarturile 
generală a relației. perl păr zale pp A 
Această linie) care juz 
_ajusteazá cel mal bine posibil norul de puncte s se num ii IN în irei A 
de regreste. “Linia obţinută este de fapt expresia grafică a modelului analitic 
-| Y=%). (2). În fig. 5. 15 se observă faptul că linia obținută nu trece prin punctele 


A opierea lor, fiind separată i de acestea prin anumite 
za distanţe (reprezentate pe figură cu linie punctată). „Aceste distanţe se Al se numesc 
e i dc a e iute sida si aceste dica nu sunt luate în 


Mi OO 
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| piele modelul PA PEN devine au numai. incomplet, « çi și “fals. Din y 
Daga cauză, modelul analitic statistic c devine Y fE) te sau, mai exact, Y A 


grs paie y paa e cu aji torul a acestui pu i 4 utila y 
i cercetătorului doar în măsura în care modejul este suficient de. fidel realităţii 
pentru a funcţiona. ca o lege empirică. si în măsura î în care este suficient de . 
simplu pentru a putea fi utilizat în evaluări, comparații sau combinații cu alte 


“legi similare (Chapot, Dauphiné, 1977). În procesul găsirii modelului analitic $ | 


„Care să ajusteze norul de puncte trebuie avute în vedere două probleme, y 
Prima dintre acestea este legată de traiectoria liniei de regresie care A 
se. obţine. Astfel, se poate găsi o. ecuație care să descrie o curbă care să. 
„treacă prin absolut toate punctele norului. În exemplul din figura 5.14, unde - 
sunt 7 puncte, ecuaţia obținută va fi o ecuaţie de gradul 6, posibil de 
“rezolvat. Distribuţia va fi astfel complet descrisă însă cercetătorului îi va fi 
imposibil să izoleze şi să studieze fluctuațiile accidentale, care în geografie Í 
„sunt deosebit de frecvente şi deosebit de importante, deoarece permit E 
descoperirea factorilor răspunzători de sebpbriamentul, dpeţial, al, unui y 
$ fenomen oarecare în plan local. AS A 
AR „A doua problemă — şi cea mai importantă ~- este aa unei 4 
E funcţii de tipul Y=f(X) cât mai simplá, care să conducă la o linie de regresie. . | 
„cât mai fiabilă, fără a fi perfectă. Descoperirea acestei linii de regresie 
de presupune utilizarea următorului algoritm metodologic: alegerea tipului cel 
mai indicat de funcţie, calculul čočficiențiiot foncngi, şi controlul idagi 4 
4 aces rezultat. | 9 4 A i 


„Alegerea ı modelului de: regresie liniară 


pes modelului analitic ol de a. f via nu se Ada zi 
it bee pe o anumită „reţetă”, pe un anumit algoritm valabil 1 în toate cazurile. 
Matematica nu oferă decât o colecţie de funcţii liniare sau non-liniare, dintre 

f care cercetátorul o poate alege pe aceea pe care o consideră a fi cel mai bine. 
„= *ptată pentru a descrie fenomenul. analizat. “Funcțiile matematice sunt. 
descrise de. ecuaţiile corespondente, care sunt de fapt „scheme de organizare. 
ale lumii î în care trăim” (Chapot, Dauphine, 1977). Deoarece sensibilitatea 
„umană este cel mai bine adaptată să sesizeze relaţiile. liniare. ale lumii. 
i înconjurătoare, „cercetătorul are toate motivele să prefere funcţiile liniare, să 
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-$ 


T t toriza lo prin eficâcitate, comoditate şi simplitate. PERN Me 
EN Dm: onceptul . „de .. liniaritate decurge . din : dad ditvitii 
S RRE O variabilă Y este o combinaţie liniară a unei variabile X dacă . 
variabilă. Y este o combinaţie, aditivă « a variabilei Xx Fora. modelului. de py 
Lal id es te, c cum. s-a a văzut, aditivá:- A i a 
| E aa At Pee dd ¿Ye că bee 


Ye = 0 varois ARNE observaba. Ed 
X= = 0 variabilă” dată, cu valori cunoscute; 

G = o variabilă aleatoare neobservabilă; : R SEE 
í a = = coeficientul lui X (parametru care trebuie. estima); LoS 
Pa termen constant. {papae | care trebuie im) | 


K pa 


"De uitoe ori i însă, teoria pe pu A la lelei în care re relaţia | 
“dintre variabile nu se poate reprezenta : sub această formă liniară simplă. De. . 
"exemplu, modelele de interacțiune spaţială sunt. modele, multiplicative, í cele ki 
de creştere a populaţiei urbane: sunt modele exponenţiale (sau logistice, în 
cazul î în care se fixează e: valoare-limită ar od etc. În aceste cazuri, este 


niaro si E de liniarizare a lor sunt: 
: o Funcţia putere: ii Ri =. axe “e. And da 
¿caro iniarizat, devine: pură = Joga + tor 
a "Funcţia exponențială: Y’ Dag o OT 
care, , lniarizată, devine: `- -LogY = = bX" pait 
de - Prin urmare, în alegerea : modelului de regresie, totii | întâi Aiai 
ias relației studiate: (prin examinarea. norului de puncte) şi apoi trebuie 
l „verificată ajustarea norului prin funcţia: corespunzătoare. “Dacă funcţia este 
Ai „non-liniară, se va nds oe te întâi i E liniarizarea $ sa E apol se va pă io regresia. | 
i optica e > : vi mp pa 


Calcularea a coeficientilor de regresie i e bi 


pe Pete ch x este vada fidepcctan $ si ia Y este variabila 
decada ecuafia dreptei de regresie” va fi Y=aX+b, A calcula coeficienţii 
„ Acestei ecuaţii înseamnă a avea ulterior posibilitatea d de a afla valorile estimate 
sale, hi 5 care e vor Acid trasarea „Ai dara dd CE În 5. 15, 


"a 


măi estimate dak iui Y E » A A A $, Lo. pentru a 206 coleaşi Eat 
Xa Xa As Xo E: Xo XA, cunoscute, au permis aflarea puncte elot 
bs a nb’, c' de "fe" prin care este trasată dreapta de regresie. aL | te | 
1 Problema cars se pune este următoarea: cum trebuie să îi fie aedi 
tic a şi b încât estimarea lui Y de către ecuația Y=aX +b să fie 
cea mai bună posibilă? Pentru a răspunde la această întrebare este necesar 
să se fixeze un. criteriu care să permită evaluarea ajustări; realizate, 

satui Dacă se erp că X şi Y sunt două caracteristici care descriu o 
q eri M compusă din n elemente (i=1, a, .n), atunci oricărui element i i din 
| mulfimea M îi corespund: modalităţile X şi Y, ale caracteristicilor X şi Y. Cu 
y se cuvinte,. pe diagrama de; distribuţie se vor trece punctele i (X,Y), 
-¡AXP)...¡ (X.Y). Coordonatele Y, (adică Y,, Y... .Y,) sunt valorile observate . 
“ale lui Y. Coordonatele Y, (respectiv f,, $,...P.) sunt 'valorile estimate de 
Sg către: dreapta de regresie f= ¡=aX,+b (de exemplu, P,=0X,+b). $ 

i TRI of Diferenţa dintre valoarea observată şi valoarea estimată se nume so AN 
"reziduu de regresie sau eroarea de estimare, şi are forma: Yf, = e, 
„Reziduurile pot fi pozitive, când f, este sub-estimat (cazul punctelor a, d, g 
“de pe fig.5.15) sau negative, când Î, este supra-estimat (cazul punctelor bi 
Le e, f de pe fig.5. 15). Fără îndoială că ajustarea va fi cu atât mai bună cu: 
„cât eroarea de estimare e, va fi cea mai i mică avd paa fiecare | dintre 
cara mulțimii M. o | 
$ Dar care dintre criteriile obale, care să fină: seama de wie 
E valurile & poate í n utilizat? Lai această tiruri există ! trei Făspunsuri 

: posibile: i de EN | 
HNT 2) Primul criteriu « ar aa A să es suma tutiror iti (Es), ingl! 
"mu este o soluţie bună, deoarece rezultatul va fi întotdeauna zero, fiindcă, 
„erorile. de subestimare le anulează pe cele de supraestimare; he 
i -b) Al doilea criteriu ar putea f. suma. valorilor absolute; ale tuturor i 
: PER (Z|e,]): este un criteriu corect (suma nu se anulează), însă extrem 
"de incomod, deoarece este foarte pa a ti o pe: tzara de aflare a a. 
parametrilor a şi d; E $ E 
| c) Al treilea criteriu ar putea fi riid sina mai mici dino, adică 
„al sumei pătratelor reziduurilor de regresie; E(e,)?. Acest criteriu pare sá. fie. 
„cea mai bună alegere, deoarece un. pătrat. este întotdeauna pozitiv, ceea ce 
"face ca erorile de sub-estimare să nu. se anuleze reciproc. cu cele. de 
supraestimare. Mai mult, acest criteriu are avantajul: de a conduce la Milea 
> a şi rapide de calculare a coeficieriţilor de edrteie a si b. 
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"Conform obiectivului vizat, a aplica metoda celor mal RIC pattar 
„înseamnă a găsi acele valori ale lui a şi b care pot să conducă la cea mai. 
"mică sumă a pătratelor ecarturilor « dintre valoarea « observată si, = valoarea. 
sd f & 7 = ap) EAR act E Supl pe pg | 


= mină q -ty = ea tr a, oe 


n ja obține, valorile: lui a sub e care > să a permită o cea mai mică sumă: a : 
i patratele. | ecarturilor . si 
i înseamnă .. deci a. “găsi m 
"acele - valori. “care: voro 
: minimiza: -varianţa - | 
| : PRTAAIgE, .ecarturilor: | 
06) = minim. Ştiind că. | 
` varianţa unei distribuții | 
„este“ > media ` ` pătratelor | 
-ecarturilor fiecărei ai 4 „| 
nolan valoarea “medie! şi . 


«y ştiind că că valoarea medie |. aa : Noo KIN 
518 este. ..... O LAN N popa mană T 


1 ` A 2 Ar Y De 
pl Thi $ > E E. No 2, 


i my a a Sau ara să $ T Reprezentarea aici a calculării 
i au o dp atoli i „variangei." decidi ri r. ie. 

sA atunci varianfa (09 în în Y en, A Eoy 
a distribuţiei va gri 


en 


isi 
T DRU rr AA 
Ai. Apa asfi Vevident. faptul că, pentru. a afla parametrii a şi b ai | 
opta. interesul major îl reprezintă cunoaşterea varianfel variabilei 
dependente ` Y precum şi cunoaşterea relaţiei dintre aceasta şi varianta | 
AN brete gr X, Care, pi analogie, este: e 


KAF 


“7.01 Vezi subeapitolul "Coeficienţii de corelaţie”... 


O ei 


F Y: XI ` LS ye JE ii , 
: x E OAT a ai A vacă j | 


| Ha 5, 16 osea: contribuţia fiecărei. eT {rési e a 
es judeţelor « din tabelul de mai jos!, notate pentru comoditate peg grafic cu î, 3; 
3,4; 5, 6, şi 7) la varian aja y variabilei xl în nete de cel de la varianta. 
ars Y am het d de; re A A OS 


| : EE x | 


: [arome 3 pă ali] 


A pito ikea 


E 5-SUCEAVA a UA 


a Astfel, ed G pe el ara 1 (Vrancea) | e varianta 1 în Ye este sor 
= (-1, ¿052 == do 10 = pátratul ecartului' dintre punctul Î şi. Y. Contribuţia: 
| aceluiaşi punct la varianța î în X este să CAE a; a en 0, 80 = piata 


ADS Tabelul este > Mali dibi de la capitoli -Coesciei d de corta, însă valorile n m 
mai sunt rotunjite la o singură zecimală. E od 
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ive  pentri p punctul 5. 
(Suceava) sunt (exs)? = 0,04 şi doy)” = “= 0,20. Se observă prin urmare e CA 
„unele observaţii - contribuie într-o măsură mai mare la varianţa distribuţiei 
(Vrancea, Vaslui, Botoşani, Bacău, Galaţi, Iaşi) i iar altele într-o ară $ mult i 
“i mică (Neamţ, Suceava). : AR 
i + Cunoscând faptul că sol două variabile ccileeză x împreană, 'se oponis A 
calcula covarianța, ft! q. cunoscută: i 


ci ag rad cba ; „Sa, au: 2 Lea E 


i Pentru exemplul n numeric o covarianța e este > următoarea: 


ÎN cita dintre. punctul n şi Xx “Contribuțiile respecti 


"COV = Eero = la Y. A a Da F en’ de ab e Ys + Os t 
“+ exe eye + ey + exs * 0/8 = [(0,89)*(-1,05), + (0,74) (1,35) + 
(0,59) ° (-1,05) + (-0,32) +(-0,15) + (0,21) + (0,45) + (+0,74) ° (+1,75) 
+ (+0;86) e (+1,85). + (+ 1,14)" (+0,45)]/8 = (0,94 + 1,00 + 0,62 ia 
qa 05 + 0,09 +1 30. + 1,59 de 0,51), =6, 10/8 = = di e Ma 
pa Dina acest ; moment, p aplicant mei end mai mici pătrate pu Ps 
itia constantelor a şi b ale regresiei. Reamintind A că F metoia i 
E lin, q minimizarea tir în P adică iri Să Ki 


E aa mino? a. = miau ox ON | A 
Der ide că 8 coeficienți a si b se obţin prin metoda clasică ñ anulării a 
. Primelor derivate 1 în Mr ca de a gi de că ale La de mai. sus, operatia 
Sare co conduce la e a e a | 
Mape n 4 ora -0. 


e 


A ate j ` N şi 
AR, IIA E aSa 
O RD a E a A e 
s . q e. nd y . EA a Atu AS ; 
AOE Drit Re ai o Ye ARO ARD E a G 
a 2 a .. ` or fi sA T .. ` ră | Ea Ir SN Cei PA Air = 
3 ES EA - - ` ir A a S OO RN n, în 
A Aba e e aa “+ de DAL est „Cab ip e Ta Re metil a AD «a 
AA ERE A e O N e, PE A SE 3 
> > nope Dee, = Aia Io N i 
A E a P O. S ME CER "Eak 


3 adică s a este e mor dintre ovarian şi vecina ii A iar: 

n n ~ b= až AI 
aA uba E T mai. sus. sde enla: a ial regresiei sunt 
ble pentru dreapta. de. regresie care exprimă pe Y în funcţie de X í 
(Y=aă+b); dacă” se > r, AA hi X1 în i tadeg de Y ETTO 
„ formulele devin: da 


D i | sri pă apr 
alta a este e raportul dintre e coran si varian lui E lar. : 
A a a ati al d mu ma AS | 
í. Din para de mai sus rezultă. pe niy o > parte că a este raportul 
. dintre -covarianța distribuției, -respectiv COV q Şi Varianţa . variabilei 
independente, respectiv ox, iar pe de altă parte că dreapta de regresie trece. 
d prin al centrul de gravitate al norului de puncte, de coordonate X, Y (deoarece 
<b = Yax => Y= ax +b). Prin urmare se poate stabili legătura existentă 
între parametrul a şi coeficientul de corelație Tae | Deoarece se Aerei X, Y, > 
Pe oY si Tar pe se dE că. a Crd : 


y . e, ET da Eir - E i è T “ qe : 4 
j E } ES 5 e. e rue, E . .. qe 
O ME es 23 a ci dee Eee cetei A 3 F. XY y 
E a E 7 tl y e 7 KK A Es z: A 
4 pi . Pe i 5 a Aa a Ca : Y SA à 
d t o.» : or a A Ă 3 


ta aE Paz ear al YE 2 A 
A ci T L < 


că a E COV, E T N $ di 
le Troia i în fala de plena a parametrului a termenul CO yr cu S 
ii sa obținută mai sus, se obţine: | y | | 
IEO A e qe. a 
iar b se A A după aceeaşi formulă. Prin urmare, atunci când se: i 
Cundaşie ca ini de taria dintre X si Y este inutil să se calculeze 5 
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covarianga dintre X; si Y Y peniru. a gás valorile corespondente parametrilor de 
regresie. 


a producţiei industriale, COV = 0, 762 iar 02 = 0,55. Ínlocuind în 


În Pa numeric referitor la relaţia dintre rata (untul: şi a di 


expresiile de mai sus, a = 0,762/0,55 = +1,38 iar b = 2,25 - 1,38-2,14 


„= 225 - 2,94 = 0,69. Ecuația dreptei de regresie devine: 
Y= 138X - 0.59 a ¡grua visai adm ante dia EE 


-Interpretarea parametrilor de reppe, 


` După Gilcuilarea soolicientilor regresiei doiak legitima urmátoarea | 

tod care este semnificaţia celor doi parametri a şi b şi cum pot fi 
utilizaţi ei în „explicarea ” relaţiei dintre variabilele considerate? Utilizarea 
piei exemplu grafic poate facilita înțelegerea răspunsului la această întrebare. 
"În figura 5.17 sunt prezentate două relaţii perfect liniare între 
punctele care descriu distribuţia a8 şi respectiv. A; observaţii. Pentru prima 
regresie (cu pur cotele sub forma unor pătrate pline) se observă că pentu o 
creştere p a valorilor lui X cu 10 unităţi (%-X=10) se obţine o creştere q a. 
valorilor lui Y cu 5 unităţi (X-Y,=5). Dreapta de regresie descrie, împreună 
Cup şi g, un triunghi dreptunghic. Aplicând formulele geometriei descriptive E 
în respectivul. triunghi, se poate afla valoarea: unghiului a dintre dreapta de 
Tegresie şi p, unghi care este de fapt panta dreptei de regresie, respectiv. 
coeficientul Ae! numit si coeficientul stil al tri a= tga = = k ka = 
5/10 = 0,5 ; de : 
|  Cosficiental! a este e fada: sli de paiak al relației dintre i 
cele două variabilo, indicând mărimea creşterii lui. Y în funcţie de X (în cazul ` 
prezentat, „pentru o. creştere cu o unitate a valorii lui :X, valoarea: 
Corespondentă. Y înregistrează o creştere cu o jumătate de unitate). Faptul că 
a este un indicator de magnitudine este clar dacă se analizează comparativ şi 
Panta dreptei celei de-a doua regresii (cu punctele“ sub forma unor pătrate 
goale). Se observă că în acest al doilea c caz literar P E X-X) = = 10, qAr 
(adică Y, Y) = 10, de unde: i | 
E tea” = (q+nIp = 10/10. = if A bis 
Panta este mai mare decât în cazul primei regresii mE > - 0,5): pentru o. 
Creştere cu o unitate a valorii lui X, valoarea dida Y cb echo 

Q isi ci identică. a dă 


¿e Pa k Ero E ra 
y nik clar faptul că bl ca a EA de Y 
al doilea coeficient al. [30 i ci AN 
- regwesiei, este parametrul . |: | ono o ARa ah “sil 
care. determină poziţia |“ sta do a 
„punctului: de intersecţie AP 
„al dreptei de regresie cu: | . Ñ 
| axa Y, atunci când X este | 
0; din această cauză, bo 
“mai este denumit şi | 
_ originea sau interceptia |- 
dreptei de regresie. În | mc” ANTI ca Ne azi A ai: 
SAL co uo H | ii Figura 5, T. „ Reprezentarea + grafi aficá n 
este prin umare Y = „interpretării şi. ara geremetnilor de 


Es ai “Adi În pam Mais Al 

celei de-a doua regresii, i Uren 
dreapta, trece; „n origine, deci b = S0; de unde rezultă că. ecuaţia e este Y Ya 
1X +0.=> po ye | | | 

| “Cunoscând magnitudinea (a) şi originea (b), se poate estima oricare 
Y. pentru o valoare X dată: 2450, 5% +15. Dacá Ă, = 65, atunci Y, = 
65° 0,5415 = :32,54+15 = 475 | 
Reluând exemplul numeric, unde ecuația dreptei de regresie era 

| Y=1 ,38X+(-0, 69), se poate acum „explicr” relaţia existentă între Xx 
- (proporția populaţiei urbane, judeţene din . totalul- populaţiei urbane 4 

României) si Y (proportia producției industriale judeţene din totalul producţiei 
d industriale a României): Bent fiecare anen de 1% a fe ei urbane, 


Intensitatea (forța) reli formă de control a modelului de | 
regresión | ; 


po mii a şi dl al i ecuaţiei den regresie i iti formi 4 şi denia | 
| i tă existente între. variabilele X şi Y, însă nu oferă nici o informaţie 
„referitoare. la justefea estimării valorilor Y de către dreapta de regresie. 
„Eliminarea acestui neajuns se poate face. cu ajutorul coeficientului de corelație 
liniară ra care. măsoară reducerea varianței > variaba qu y paa d atunci 
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„ „când. variabila. independentă: X este utilizată pentru a estima valorile Y. — 
l Utilizarea coeficientului de corelație este legitimă deoarece prin adoptarea - 

+ modelului: de regresie: Y=aX+b se acceptă implicit că variaţia totală a. 
"variabilei Y depinde de variabila X. Cu alte cuvinte, se încearcă explicarea 
; “varianţei lui Y. (adică a cantităţii. Ly?) prin raportarea' sa la varianţa . lui X 
Hi (adică la Ex?) Făcând apel la o analogie, . se poate spune că variabila. 

- independentă X funcţionează ca un “burete ce absoarbe o parte din varianța 
"variabilei Y (Abler, Adams, Gould, 1971). Problema se reduce la: a determina . 
` cât anume din Ey? este „absorbită” de Ex?. Procedeul de apreciere as 
E eficacității modelului de regresie se wor analiza ca si este clar | 
îs de ideea de corelație. A HA i et! 
k -İn tabelul următor, . Variante, totală î în `Y, respectiv suma pătratelor . 


„esarturilor SPE = UIH 220 
pu SPE m HODHE pisive as | 
m a ai că i 


DE, este" 10, 94. în figura. =— 
.: 5,18, cu linie punctată, sunt —— 


indicate ecarturile Y față de EZ 
Y. Aplicând- “modelul NI Bors 
Ali regresiei calculat în paginile |: A 
| plete Y=1,38X-0,69, 


IN! EOE a| 
paapa ae a 


‘s în mod clar că ecarturile E 


„» se obține dreapta de regresie 
si din figura 5.19, trasată în- 
$ fincție. de f. Se poate vedea 


sucia al ref sa lee S 
a Ter aE | 


| 1,20 102] _. 
18,001 1054 E 


| „ Valorilor observate Y faţă de- 
valorile estimate Ê sunt mai | 


| 
~. mici decât cele față de F. Ds ecart tip _ MEE] 
. Suma: pătr«:sior. acestor - | 


| ai „ecarturi EP, caleulată i în tabelul următor, este 2, 53. 


pe es evident: că MESEC, respectiv 10,94>2,53. O parte 
"Aia a 2 varianfei originale a lui. Y (10,94) a fost absorbită” (10,94-2,53=8,41) 
Se prin acțiunea variabilei regresoare X. Partea absorbită (8, 41) se numeşte 
yet q. lo da ia d iar sl neabsorbitá Q, 7 se nm 


t vezi i și i esp” “Testo e pros. E IS R ap m 


a 


j arkni reziduală (Ey = Sgi, m ti A A te z | si 
A VE aciaia totală nau râdă = suma pao ecarrilos) lui i y este. 


Eon j = «Front > -a-y -2 TAN 


X ai i T ei. 4 Je Ti 


by) Deoarece ii dini R Gii OS central al ecuației este nul, respectiv. 
. KF- =0 m pena qe valorile, Piece. R ce le « est timate poen F 
zero), rezultă că aho budismo a AO No E T 


` LD 4 a . A « e Y at pg Sn e gr 
ys ai CAR A an Na TI 4 TA » aa i să ” stea „A AS A Je E A » 3 AAN a - a 
o încât ecuaţia SPE devine e EE ri En ds a O MA a oale set UE 
RIAS Xi psi fiinte a M A AE aeaa 8 E 
JE a DĂ A A A i, h e.: e ra k J a es a“ a; E LEI 


e Br: pompe pt 


iai: stiri AP 


de ceea cs mai i poate f A soris s astfel: pnl AA er op to A. 


4 t Fara 5 18. Reprezentarea TR , Ez 5. 19. E == 
SO dor ga variabilei Y vf de ek „E d a ORNE variabil Y Ea de Y. 
E, piji urmare > E spune că varianţa totală a lui Y i 0? 5 se compune dia 

Ki, varianţa explicată (respectiv 92) plus varianţa reziduală (adică a? y y). De 


“aici se poate calcula varianta explicată, e meg hernan determinată bo 


- introducerea variabilei Xi in calcule: MES 


A La 
a i 


A a dr 


(varian explicată = vári inja a totală - vacianja reziduală) 


Raportul i dintre vari anta to cată şi varianța totală se numeşte 


` coeficientul de determina re, care măsoară partea din variana tu ¡Y 


Y 3 


ex aplicată” pl utilizar ca val iabii ei X în modelul de regresiea 


ji A i 


i le! a 
E Bega 


pri urmare, P?yp, 1 i Aieaiată partea de varianta totală determinată de regresie, 
se exprimá de fapt prin raportul dintre suma pátratelor esarturilor de regi esie 
Şi suma totală a patrartor ecarturilor: (eg d 


|. 


| E y H: -me 


AS 


E E 21 ` az 


del ial 


gps be 
DU ap bi 


A Se deduce că partea ncesplica” din varian ui Y ra; J este 


„des, Ya Tra 


aE del de “numeric, p?,=8, 41/10, 94 = 0.768, 
Coéficientul de determinare este intuitiv mai usor de interpretat decât 
coeficientul de corelaţie, datorită faptului. că se poate "citi" procentual, 
deoarece poate fi calculat. şi astfel: 1?yy = (029/027) * * 100 = (8,41/10,94) * 100 
. = 0,768 + 100 = 76,8%: utilizarea variabilei X explică 76, 8% din varianta 
dui bi Pentru corectitudine, trebuie să se țină seama de faptul că termenul „a 
explica” este utilizat în statistica geografică datorită încărcăturii sale 
| emoţionale (Johnston, 1978); în statistică se. spune | că 5? permite 
| „ determinarea” sau „calcuiarea” varianţei lui Y în funcţie de X. 
- Coeficientul de determinare, fiind un pătrat, este întotdeauna pozitiv 
E oscilează între 0. şi +1: cu cât valoarea obţinu pentru r2zy este mai 
È ` apropiată de +1, cu atât ajustarea norului de puncte. de către dreapta de 
| regresie este mai bună. Din această cauză se poate considera că r°yy este un 
y instrument t de control a al modelului de apre ales. | 


r. bki Trebuie să fie remarcat de asemenea faptul | 
„că cădăcina pătrată a coeficientului de determinare 
Re este coefi cientul de Celada 


+ Ta iE 


e “în cazul î în care se compară, pentru aceeaşi. E, 
khia regresie, Tm Şi 7?yy, trebuie să se țină seama de faptul 


/eá coeficientul de determinare r?yy descregte mai repede față de +1 decâ 


de coeficientul de erile rr (vezi tabelul: de 1 mai sus, n după Yom 1999): 


Jl i j „Reziduurile x re resie i 
“Conform explicațiilor de paginile. pp Vaal ajustarea prin. 
ieta dreptei de regresie este rareori perfectă. În cea mai mare parte: 
„a cazurilor, . [rel < +1, ceea ce semnifică faptul că punctele nu sunt aliniate 
"în lungul unei drepte şi că multe valori ale lu: Y sunt subestimate seu. 
< supraestimate de către regresie.  Ecarturile: care separă aceste valori. de și 
y dreapta desorisă de relaţia medie care leagă variabila Y de. variabila X se: 
-t numesc reziduurile regresiei.. Reziduurile e, exprimă partea din fenomenul 
PY (de exemplu. valoarea producției industriale) care nu este determinată 


< (explicată) de variabila regresoare. X (în cazul prezentat, de. ponderea 
` `, populaţiei urbane). Reziduurile: e, sunt estimate de valorile ej, Care sunt .. 


ecarturile între valorile observate Y, şi valorile festi mate de către inodelul 
„de regresie ales: e, ho -P s sau a: = -h> (aX tb), de starea ade | 
pe este relativ simplă: lo EA 
to reziduul Está pozitiv dacă n i pr ap este to superior valorii 
E * prevăzute de regresia liniară: P-î>0 <=> Y> fy 0 ice di 
„vu. = reziduul este negativ Mal váloarea observată e este inferioară valori i 
, „prevăzute de regresia liniară: Y-h<0 <=> H<P; : sita i 34 
„n 0 reziduul este nul (aproape de 0) dacă. d. erau observată, este i 
i conformă valorii prevăzute de regresia liniară: Vh=0 <=> ph... 
dd „Reziduurile care se îndepărtează mult de tendinţa generală re 3 
dă de PO de regresie prezintă o mare importanţă pentru cercetarea 
s geografică, deoarece cartografierea lor permite sesizarea structurilor spaţiale 


“care funcţionează conform acţiunii unor factori locali, ceea ce conduce la i 


~, revelarea disparităţilor teritoriale - unul dintre obiectivele Fundamento: SA, | 
isi egal. i. [A TREE A q 


ai în figura. 5. 20; este - ‘reprezentată ‘relația dintre. populația totală 
| pi emil şi numărul, spectatorilor. de cinema (inclusiv al videotecilor), în 
România anului 1986. Ecuația dreptei de. regresie este Y = 9,31X - 160,92. 


„„. „Coeficientul de determinare este 72==0,763, ceea ce înseamnă că numărul total 
f sal populaţiei. judeţene determină 1 în proporţie de 76,3% numărul. celor care 


E frecventează” cinematografele, restul. de B, 7 % leii ezită) fiind 
‘o explicat de alţi factori. 4 
Cartografierea reziduùrilor. de regresie > Ge 5. 2 permite 1 pe. de o pare 


- sesizares. cazului: special 4 


"al: Constanţei, care, 


-lansarea unor ipoteze de | 
> lucru penti pia si 


E beneficiază de. afluxul |. A pe 7 or z3 
ta estival al turiştilor, i pel A 
-de` altă. parte. permite. OS 


o geografi SPT d si 
i „Na -a) Faptul sa] 
„reziduurile -reflectă TARNED, 
| subestimarea lui Y pentru | = |.” 
A Constanţa, ` EE a a i 
-> Galați, Brăila şi Călăraşi 10 HE O 0 C 
~ poate fi pus în legătură L- prado (o) 
"cu traficul de casete Figura 5. 20. run numărului de speci at de 
video: efectuat prin „cinema în dies de populli totală județeană. 


sa ` porturile din zonă, Jucru + 4n 
i n ce poate facilita aprovizionarea cu a filme a ‘Videotecilor? | 


PARA -b) Subestimarea lui Y pentru județele din sud-vestul țării (And, 
E Timiş; Hunedoara). poate. fi rezultatul traficului de frontieră între Banatul 
ve „românesc $ şi cel sârbesc, o altă posibilitate de aprovizionare cu casete video? 
a Turismul si urbarizarea pot explica reziduurile pol din sudul 
ii Transilvaniei (Alba, Sibiu, Braşov), sau din Vâlcea si Argeş? pei 
A - -d) Care este ponderea factorilor vii în crearea şi susținerea 
| agregatelor spaţiale sesizate pe hartă? < = 

-e) Care poate fi explicaţia pentru inerția? faja de cinematograf 


i > nieta în judeţele din sudul extrem şi în cele din nordul extrem al țării? 


da -- Răspunsul la aceste întrebări poate- fi dat cu ajutorul altor regresii, 
y sau prin: intermediul u unor peages amiini care vor fi peruano în volumul 


-al doilea al acestui curs. Cert este faptul că analiza cartograficá a reziduurilor 
regresiei este o metodă utilă de studiu a organizărilor spațiale „ascunse”. 

- Utilizarea aceste metode nu este. însă fără pericole, deoarece, pentru ca 
` rezultatele să fie reale, boli îndeplinite u următoarele câteva condiţii, : 

Mia rated capa 


i a 5, ZI. Reziduurile aves numărului de s pectatori da cinema aMn 
i Pate de e populaa i totală a Keeler, prin dl sure rm at | 


| a dna priva ad, se dit a media aritmetică a teziătiurilor. o 
| em nulă: E(e)=0. Altfel spus, valorile estimate Ê, sunt” „medii” în raport 
cu Y, obseryate: aceasta înseamnă că se consideră că reziduurile sunt pozitive E 
„şi negative în jurul Jui 0: şi că suma lor este 0 (Ze, =0). Tae N 
+2. A doua ipoteză este homoscedasticitatea reziduurilor, feupectiv “a 
| ipoteza că reziduurile € au. aceeaşi variantá 02, pentru orice ¿=1,2,...MM. ' 
_„. Condiţia este impusă de necesitatea sitax; estimării parametrilor de 
„regresie. Este de la sine înţeles că varianţa condițională : a pa L pentru un X 
dat este si ea constantă, pentru oricare i, de unde 02 y Condiţia de 
| homoscedasticitate trebuie avută mereu în atenţie, sait ma dintre 
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variabilele cu. care operează, AO pu G satisfac, ceea. ce. falsia gev. 
g rezultatele regresiilor. şi interpretarea acestora.. TE | 
y Hi ` Homoscedasticitatea unei distribuții L Veniet e cu zaj tije erorii . 
lont (ES) a estimării. lui Y. Eroarea. standard a estimării lui: Y. este . 
R” rădăcina dio a zică distribuţiei normale a reziduurilor: die € 


A - ES este eroarea. puii reziduală « a  regresici; rii rii 
` = Øy este abaterea standard (ecartul-tip) al lui Y; meat e 
Asa 1-72, este varianța reziduală. a RD 
e: “i Penti. exemplul. destinat să estimeze pee, de pne, de. 
| cinema, ecartul tip al lui Y este 1772,4 4961 iar cita =. 1-0, 798. dect eroarea ` 
standard reziduală uppie: este iri a ae db e D 
ets ES æ - 177, 496» K, 13. = : 862, 596 site fala 
| ES este: prin urmare un rezumat al variațiilor? clinic e. ES 
suie să să fie a. at poppen modelului Etna de dd 
a P AT- - aX+b4 ES E afet i 
Ha Când conil il mai sus. koris: o relaţie ti, iar pa 4i, ES este O, i 
` deci nu există reziduuri; când nu există nici o relaţie între variabile şi ry=0, 
“ES este maximă. Eroarea standard a estimării lui Y se comportá faţă de curba 
< normală la fel ca şi: abaterea standard. În fig.5.22 este reluată dreapta de 
de regresie | prezentată anterior, completată (Y = 9,31X-160,92+862,60), care 
este - acum dublată de linii. paralele, corespunzătoare reziduurilor 
_ standardizate.“ "Se observă: că Niue: se bl jai ai cu 
îi aproximaţie ca sub curba normală: | 
„n mintro 4 LES şi -1ES se ¡poa 68% dintre dida jari curba | 
Ss normală, între +10 şi -løse grupează ( 68,26% dintre valori); 
aia “intre  +2E5 şi 2ES s se Ena 95% dintre reziduuri (e ito A 


normală, între +26 şi - E [30 Para nn El - 
"20 se grupează 95,46% |, E 


ala valori); 


„între; +3ES şi . Ñ o gb, UA Ma d aa 
3ES: se ` grupează. 99% “(8 a 
“dintre reziduuri (sub |$ 
„între | 


curba $ “normală, . 


“y Š 
III E DE 
As Y E A Y 


$4 EN 


„+30 şi “30 se epa | oli 


99, 15% dintre Mapa 


a Hi pose E ose at Re ie die q 


“în funcţie de ES. şi | a ae EU a 
i procentajele de sub curba 
normală este cu atât mui 
: exactă cu cât varianta în 
»! cadrul. benzilor definite, 


„Aceasta estr 
homosceda ticitatea. 


iS heteroscedasticitatea, ce 


IA 


ope (mii oc) y a: 


gara 5, 522. a de în încredere de 68 % şi 
95% pentru dreapta: de regresie a numărului de. 
; spectatori. ee cinema” în stelle de e papele 


de ES este mai omogenă. i y Res A EN T a 


OO 


“În figura 5. i pas sedasticitatea lipseşte, fiind prezentă în schimb. 


- ilustrează situaţia în care | 
 Varianţa reziduurilor. € ( 
varianja n 
valorilor Y) se mă- :eşte | 
“pe măsură ce X creşte, - 
| „ Deoarece Y este volumul 
` de gaze. distribuite în 
i judeţele. României din 
1989 
 (România= 100%), este | 
„evident faptul că acesta în 
„poate varia doar între un e | 
un maxim 


(şi automat - 


“an ul 


minimă și 

stabilite de X a este . 
Brice Rah ebai: 
d u d e uf: e a n A 


nA 
a” d 


paze distribuite (%) © 


THODE EPRT ZE? E 
populata urbană (%) 


Tigua 5. 23. „Creşterea variante zidurilor CU 
-valorile variabilei X, datorită perie deget 
Aaa. variabilei ' Y. 


8 | Romina 100%). Minimul este muti minim vital de urbanizare judeţeană 
„iar maximul nu poate depăşi -în cazul extrem- populaţia judeţului. Maximul 
este din ce în ce mai mare pe măsură ce X (indirect ă= numărul de arzătoare 


casnice şi industriale) creşte, prin urmare, varianía lui Y, sporeşte odată cu 


X: condiţie de homoscedasticitate nu este îndeplinită. 
3. A treia condiţie este lipsa autocorelaţiei între reziduuri; în esență, y 

această condiție este concretizată prin ipoteza independenței reziduurilor. 
Reziduurile sunt independente dacă coyarianta lor este nulă: Efe,,e) = 0, 
ij. De aici rezultă si faptul că Y, şi Y, sunt de asemenea necorelate. | 
Autocorelafia (si mai ales „Aiocorelala spaţială) va fi ARAMA, i în volumul 
„al doilea.. 

| 4 A patra si ultima condiţie este et st pg distribuţiei 
reziduurilor e, 7. Această condiţie are un caracter obligatoriu atunci când se. 
„ doreşte testarea. parametrilor de regresie obţinuţi, prin fixarea unui interval. 
de încredere. Dacă distribuţia reziduurilor este normală, este de la sine înțeles 
că şi valorile Y, au o distribuţie normală. Prin urmare, condiția anterioară, 
respectiv necorelarea reziduurilor. se transformă în independenţa reziduurilor. 

Ipoteza inde ependenfei reziduurilor este foarte “mportanta, mai ales în cazul 

Tegresiilor multiple, unde non-normalitatea lor înseamnă dependenţa lor, ceea 

ce înseamnă mai departe că reziduurile -sunt perturbate de o variabilă 
| importantă care trebuie indentificată să aaa a figura $ in mod explicit printre 
| variabilele regresoare. in 
C as a Desi lucrul, este cunoscut, este bine să se pe ea faptul că dacă 
| regresia este efectuată asupra unei populaţii, < € “adifia. de normalitate poate îi 
„ignorată, Dacă însă se lucrează cu un eşantion (de exemplu judeţele. . 
Moldovei, doar o parte din judeţele României), n amară cezar 6. 
$: deci a valorilor DA devine « o 2 condilia phligatoris: $ 


Până tn acest de pri 4 analizei de ¡dll e s-a realizat doar 
| ajuares analitică a unui nor de puncte la o dreaptă, nedepăşindu-se stadiul 
- descrierii- unei distribuții bivariate. Pasul următor este aplicarea unor 
procedee de statistică inferenţială, care să extrapoleze rezultatele obținute prin 
„ analiza eşantionului asupra populaţiei din care face parte. Cu alte cuvinte, în 
+ continuare va fi prezentată testarea modelului statistic teoretic, prin care vor 
h e peraj, i pima o ce TE sau nu să ro ri 


zi : Eo 


pr woi Pinakin ia e denon a “obţiunile « des eroare şi ¡de bol 
-teroare standard introduse în paginile precedente. sunt foarte legate de ` 
"AS chestiunea generală a normalitátil distributiilor. Dacá se fine seară de e teona i 
„erorilor, care postulează faptul că erorile ii sunt distribi uite formal, 
“atunci se ace ceptă ipoteza conform căreia coeficienţii de re ea al myi multor 
„ eganticane e extrase din ruta ai pă urmăresc d de asemene 20 „dis tru ha 
am | i É 


i “Se aie astfel “tipica sao de normal fitate p prezentată 
me dă sus în procesul construirii testelor pentru verificarea estimărilor obținute, | 
“ Testele se dovedesc : esențiale pentru interpretarea rezultatelor regresiei, 
ti deoarece ne putem întreba: la ce. foloseşte interpretarea unui coeficient a (sau 


<: a unei valori P) dacă nu se ştie dacă acesta este în mod semnificativ diferit 


cd de O saú dacá intervalul” său de încredere este foarte îngust sa sau foarte larg? | 
de TE rire Modciul statistic teoretic are formar urinătoare: | 


a y BY 


1 nd aiteeljă dintre! coeficientul kiaia de regresie. ă şi | 
E salio teoretic a este considerată a fi standardizată, pentru testarea lui 
 acao bună estimare abia se poate utiliza distribuția normală pentru 
„ eşantioanele mari şi distribuţia „7” pentru eşantioanele mici!, Ipoteza nulă 
Ho pentru toate testele efectuate în continuare, este lipsa oricărei corelaţii 
apă între X si Y, respectiv Pyy = 0, a= o si b=0. Dacá testele infirmă această 
Sa ipoteză, cercetarea poate continua prin acceptarea ipotezei alternative Hit 
` “adică i a existenței unei relații între X şi Y, respectiv |r| >0, az0 şi ba. ho 
he Ep TES pn testarea CAS g regresiei Ep testul «pi | 


k i br a f jni faptul ci regresia hi Y în “funcţie té Xx este 
o să scz E (deci că Y este dependent de 5, trebuie ca variaţia lui ye 
pa explicată de X să fie semnificativ mai mare decât c cea pai (reziduală). | 


> Prin ur urmare dacă. 


> dara k- -Jam > Ea 


Apia ee e ada e o del. 
„atunci Peste e dependent de Xx | 


1. vezi sub: asitolul "Teste parametrice”. 


TA Doar t dacă acestă condiție. le P EA se poate o concluziona că. oriki un 
factor A care are o iafluență sistematică asupre lui Y mai mare decât influența 
y, accidentală, aleatoare, exercitată de variabila neobservabili e (Beguin, 1978), 
L - Verificarea modelului se efectuează prin testul „F” al lui Snedecor’, 

` cunoscut sub numele de estimarea variānței. Scopul este acela ae a demonstra 
că atunci ¿nd coeficientul a este nul: (a=0), raportul între  varianța explicată A. 
si Variante reziduală urmează o distribuţie „F”. = > ; 
Estimarea fiecărei variante este făcută în funcio de ridik de 
„ Jibertate, care indică numărul de informaţii independente necesare calculării 
"lor, Astfel, „pentru variante. totalá, numărul de grade de libertate este (N-i) 


A " decarece este. nevoie. de. (N-D). ecarturi independente pentru a o calcula 


“(întrucât se cunoaşte că Ey,=0). Pentru a calcula varianța explicată, este. 
nevoie de un singur grad de libertate (respectiv a parametrului a), deci N=1. 
-Este evident că sunt necesare (N-2) grade. de. libertate pentru calcularea s 
“variantei reziduale, deoarece se pierd două g.l. prin calcularea celor doi 
coeficienţi de regresie care leagă Y de X. Rezultă prin urmare că, în iată 
„de e arados d de e libertate, Voia ota estimată c este. Os i 


mi. 


P Ga 


IgE 


iar varia reziduală estima o este 


, LA e san $ pi jisa BAA i 
ha aceste e condi, statistica testului „F devine. | 


„A Vezi subcapitolul “Teste parametrico”. 
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NN Din acest moment re m ica ipoteza a mută Ue nu există nici 0 
diferență între a şi ex, deci nu există. nici .o relaţie. între. Ye fin Xx. ¿rolagik E 

tn măsurată fiind datorată hazardului î în alegerea esantionului): ; pă ata $ 
AO dacá Fa 2 Fo; la 1 şi (0-2) gl. ipoteza. nulă Ho este Kiia 

A putându-se accepta ipoteza alternativă Hi: între a si o ' există. diferenţe 

- semnificative, deci există o relaţie între cele două ies paño care nú 

F e supusá întâmplării. 

RL, Pentru exemplul numeric referitor la Variația CE de spectatori 

¿e a c cinema zi în funcţie de populaţia totală a judeţului (X), se copie: . 

ha = (0,763)  (40-2)/(1-0,763) = 28,994/0,237 = 122,3 

| ¡8 pros. al un nivel de semnificaţie al testului œ=0,05 şi (1; 38) a4 

| ele de libertate, Fe =4, 17 deptos Ama ae deci zeta poate. fi ost foarte ey 


finde clar: cia diferă foarte dll de Ocio SA Ean 
20 ~ pentru un n.s. «= 0,01 si (1; 38) Ja de ierte F, =7, 2,56 (eri. | 
Anexa IV), deci regresia rămâne iapă Sonia, semnificativă; Ho ponte! fi 
espina | fără pee. A Ei | 


| Cu ajutorul leniti ima cunoscut al relaţiei dintre temperatură 

Şi altitudine, vom demonstra în continuare aplicaţiile posibile ale regresiei în 
geografie: sintetizarea, modelarea, . - previziunea gi descoperirea 

particularitáflos, locale. E E EEE m a, E 


=a) Sinte zarea 

Să presupunem că, prin. intrii a 500 de staţii meteorologice, A 
se măsoară temperatura medie anuală a aerului (T° =F) în Moldova, lia 
diferite altitudini (X=H), şi că se găsesc următoarele valori: 

„* T° = 10€ la H = 0 metri;. | 

| * T° = 4°C la H = 1000 metri; > 

Sole. = -2°C la H = 2000 metri. mb 

Ne putem întreba dacă este într-adevăr util să se. Ap i ERD în 
fiecare zi temperaturile sA obținute. Statistica oferă un răspuns imediat l2 
această interogatie.  naliza seriilor, de valori demonstrează că există o 
puternică corelaţie. negativă. ryy = “Pri 205 900 între altitudine şi 
temperatură. Calculul coeficienţilor - de regresie a condus la următoarele 
„rezultate. ¿=-0,006%C (temperatura Y=T* scade cu 0,006*C când altitudiriea 
X=H creşte. cu i metru) sib=10"C (beste originea dreptei de regresie, 
"respectiv valoarea temperaturii Y când altitudinea X este zero). Prin urmare, 
ecuația dreptei de regresie este Y=-0,006X+ 10 sau T° =-0,006 ° H+10°C. 
‘Coeficientul de determinare al regresiei fiind pătratul coeficientului de 
„Corelaţie, rry = 0,900. => Io =.0,900*0,900 = 0,810, rezultă că 
„ecuaţia permite sintetizarea (rezumarea) esentialului (61 %) din variaţia 
Ros, a Aa odată « ce se eemo altitudinea. i 


or Trebuie să fie remarcat că simbolul a este folosit atât pentru : a nota o pei teoretic al 
Ñ hi lo cât si paye dra de a grei anah se cc ad me Sensul reiese clar din 
i Context. : ; A. | 
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Este evident astfel că regresia permite sintetizarea unui volum 
ke foarte. mare de informație cu ajutorul a doar doi parametri. Această sinteză q 
i e cu atât mai malebilă cu cât aias este mai goimh ie 
> Modelarea | e ste De ol Je E) A 
2 „- Observațiile- meteorologice; combinate cu analizele ze, şi: | 
e este pe tot lungul anului, demonstrează faptul că coeficientul anu se 
„schimbă (0,006 = constant), în vreme ce coeficientul b oscilează în funcţie e: 
< de anotimp (valorile sale sunt ridicate vara da coborâte irn Ce se p poate 0 
ni deduce din aceste observaţii? => m 
„Se cunoaşte faptul că coeficient a a: “indică AN Vaia Ci 
tenáperatrii î în funcție de variaţia altitudinii. Astfel, o variaţie a altitudinii de - 


„100 m corespunde unei oscilaţii a temperaturii de +0,006 * 100 = +0,6*C. AÑ 


E obține astfel gradientul termic, o constantă universal valabilă pe Terra... 


- Coeficientul b în schimb, indică valoarea temperaturii atunci când altitudinea . . 


este de O m; coeficientul b este deci temperatura medie la nivelul mării. Se. 
„verifică astfel una dintre legile elementare ale climatologiei, mai exact spus, Y 
„se verifică unul dintre mod+"-le fundamentale ale climatclogici. E a 
= * Apare astfel clar Japtul că regresia liniară are capacitatea jè pi | 
modela degete dd oma geografic, Sa er Aci sriingific. 
] | Dacă bületinuti ineteo ERNA: anait o 5 nperi E de 15 soc 
L pentru Mok: +a, O persoană dintr-o Tocalitaie TárA stație meteo, care cunoaşte”. .. 
altitudinea propriei . localităţi, poate estima temperatura locală. Dacă ip 


temperatura medie ia nivelul mării este de 15*C, ecuaţia dreptei de regresie i, 
„va fi de tipul T° =-0,006 °H + 15 e. Presupunánd că altitudinea absolută a. 


i localităţii respective este de 500 m şi că gradientul termic rămâne stabil, El. 
„ temperatura localităţii în discuţie este probabil de 12*C (dacă gradientul p: | 
„rămâne stabil, este suficient să se scadă câte 3°C pentru fiecare 500 m“ 
e altitudine să pot de la niveiul mării: 2, 006 dese -> E de 
120). cd 
i *Regresia permite extrapolarea, enbaralol pini pe un 'ejabtioni; f 
| cu alte cuvinte, regresia permite previziunea tuturor minvi cul Y rani se k 
„cunosc valorile lui X pentru incida Pri. | | 


9 Descoperirea particularită filor fiec Gaup punerea di n evidență m 


E unui efect e mascat de un efect ie E : SERA i 
eses, Amintim faptul că analiza cartografică a diar a A v este ua 
i important de studiu al structurilor spaţiale, ne putem întreba: ca. 
informaţii sunt obţinute prin cartografierea reziduurilor ecuaţiei dreptei de 
ireala T*=-0,006 + H+ 10*C, rămasă valabilă tot timpul anului? | 
“Răspunsul este simplu: reziduurile corespund varianfei reziduale 1-7", 


P ele dau seama de 19% (adică de 1-0,810) din variația spațială a 


„temperaturii neexplicatá de altitudine. Prin urmare, reziduurile pun în 
„evidenţă microclimatele determinate de orientarea Yptsanților, se vegetaţie, 
de accidentele topografice, de activitatea umană, ete. Astfel: 
| => Reziduurile -pozitive corespund micreclimatelor calde 
(temperatura este mai mare decât ar fi lăsat altitudinea să se presupună); 
>, Reziduurile “negative „corespund „microclimatelor reci 
(temperatura este mai scăzută decât ar fi lăsat altitudinea să se presupună); 
= > Reziduurile nule corespund giga: ui conforme cu cele pe 
caro altitudines lăsa să se prevadă, Al 
E Reziduurile permit aşadar descoperii 2d a factorilor pol al care | 
inf luenteazá variaţia spaţială a unui fenomen, odată eliminat efectul factorului | 
Principal; este de vizei eel specifica letal. al unui teritoriu oarecare. 


-me 


3. 4. Măsurarea a rela d dintre două caracteristici calitative ordinaie 


| la paginile Horia s-a bocatas a melodele analitice de calcul A 
) le PR re pe sunt aplicate atunci când distribuţia variabilelor este normală şi 
"când există informaţii asupra parametrilor: fumeţil care realizează legătura 
| dintre variabilele respective. © 
„Se cunoaşte însă faptul că o serie întreagă de date ile nu pot 
„fi măsurate decât pe scară ordinală, fie din cauza naturii informațiilor 
(preferința persoanelor pentru anumite oraşe, de exemplu), fie din cauza 
faptului că: valorile cardinale. sunt nesigure sau au O distribuţie mult prea 
neadaptată unei transformări într-o distribuţie apropiată de una normală. în 
aceste cazuri, chiar dacă se bănuieşte că între variabilele astfel măsurate 
există o relaţie, calcularea corelafiei prin t metodele prezentate nu este posibilă, 
3 deoarece: distribuţia nu este normală: iar informațiile dapes: iara | 
iza. lipsesc, | 
„ Singura posibilitate d de măsurare a relaţiilor stabilite între asemenea | 
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„„„„V&TIabile Sunt metodete neparametrice de ca:cui al coreiaţiei. Una dintre. 


aceste metode este calcularea corelației rangurilor, pornindu-se de la ipoteza 
„Că între rangurile celor două variâbile există o relație de dependență, a cărei: 
-" intensitate este măsurabilă. Dispunând de rangurile! ami dela 1 la 
N unde N este numărul de observaţii caracterizate de variabilele „asiderate, | 
i măsurarea intensității corelaţiei. se efectuează fie prin coeficientul de . 
i sotilație Spearman, fie prin coeficientul de EE Kenga: y 
e i ; mn 
| * Exemplu. TT să capita preferinţele Mar interni 
„pentru unul sau altul dintre județele României, o echipă de specialişti în 
„geografie socială a avut ideea să măsoare intensitatea impactului informațiilor 
„transmise prin mass-media asupra alegerii județului-ţintă de către migranţi: 
Pentru aceasta, s-au creat două ateliere de cercetare: 
TI SA ; v — - primul atelier a studiat arhivele presei scrise şi vorbite din ultimii 
"15 ani şi, în funcţie de frecvența apariţiei informaţiilor despre fiecare judeţ 
` în articole şi emisiuni radio-tv, au realizat o ierarhie a emor ere A 


di în tabelul de mai jos); 


k, - — al doilea atelier a E un aná pe un eşantion fi zântatie | 
din populaţia î în vârstă de: 25-30 de ani, stabilind o ierarhie a judeţelor în 
e funcţie de. frecvenţa. apariţiei fiecărui judeţ în topul preferințelor” acestui 

£ eşantion de atac St ta F din tabelul de. mai Jos). ' 


5 A. 1. Coeficientul de corelaţie Erica o 


z vh tabelul de mai i jos. s-au obținut două siruri de ranguri, Wi pentru 
X Ej Xx. AX Xy) şi altul pentru Y (Y, TORRT Er. D 
Coeficientul iui Spearman se calculează aidoma céhek de corelație e 
liniară 'Bravais-Pearson, luándu-se rangurile drept valori. Pentru aceasta, se - 

„ordonează cele două şiruri în funcţie de rangurile lui X, obținându-se un total 
de 40 de perechi de valori: (XE), (XE) 0 Y), (X, Y). . (Xr In) 
-În etapa următoare, se efectuează diferența dintre rangurile caii perechi 
„rezultate: (X,-Y) ... (X-F), (X-F, ) ©. . (Xy Yn), obținându-se valorile 
| trecute 1 în coloana d. “Deoarece Suma valorilor coloanei d este 0, minate se 


“ridică la pătrat, rezultând valorile coloanei a Variable] X.Y] die! 


ua care se peer tron lui un" 


„sea a. w tg a] 
ai ea 


- care n mai i poste fis scrisă si astfel ia: Na ir 


De a 


ep a Ai SAk iar 


MA H 


- Coeficientul de pisat a al e = 
- propus de. Spearman oscilează. de asemenea „Maramures | 
“între -1 şi +1, relaţia fiind cu atât mai (0% | 
„ Puternicá cu cât p este mai aproape, de +1 şi: Asi > 


„cu atât mai slabă cu cât este mai CEER dej jäme i 
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 Inliciind: în „formulă + cu valorile ` [paoms pei în 
setului, se chan $ 


a Ao aud 

“a 089 cc mat bn sa 

- Valoarea coeficientului, p=0, 899, indică TE a 
. faptul că între „publicitatea” făcută județelor [camas 
„de către . sistemul mass- -media şi decizia |Mebeăai 

: ¿pos sibililor migranți de a se îndrepta către un pia 
-județ sau altul există o „puternică relaţie de [ialomita 

| dependenţă, de semn pozitiv. i 

ži Semnificația statistică a coeficientului j poata 

| Spearman — poate fi “testată aidoma [remm | | | 0f 10%] 
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BENSULLPLPUSVIRNANNUVSREZBN No 


ISGEBRULUNCSUUSIN 


E: coeficientului Bravais-Pearson, utilizându-se 


a. testul Student, cu condiţia ca N>5. În acest 
Caz, pentru, a (probabilitatea de eroare 


„ acceptată) şi numărul de grade de libertate date, si ia, lui 1 yy Se e citeste din 


tabele speciale, Pentru a utiliza aceleaşi tabele ca şi pentru coeficientul de 


| corelaţie jaien, „este necesar ca Nz 30. Peones în exemplul de mai sus 


ú 


11 


Zooo88dranbta-38 Pro] ni 


lo Brorras coo Boro ot 


j n=40, | se poate testa , ipoteza nulă H, conform. căreia p= =0 (între, y ranguri au 
„există nici o relaţie), aplicându-se testul următor, ce consistă î în a a calțula H 
| Stan CA la. ia (N-2) g pude de libertate: eh atei A 


3 
- dol: MZ s FZ. 
La E Alp i, E | 
Jpoteza Mie este respinsă dacă Ir la în exemplul considera se obţine 
; pentru a= =0, 05 si N= (40-2) grade de libertate: IN 


A, 290/3037 0,899 +6,14 


bi A -/1-0,802; 1-0,802 / 1 

- Din tabelul cu valorile repartifici Student, pentru 0. 05 si N=38 grade dd 
libertate, den = 2, 03. Deoarece ral (12, 6522 ,03), arat nulă este 
i besa coeficientul p obținut fiind foarte semnificativ. - a SET datată A 


4 12,65. 


tes 


eS 4 2. Soefi centul de corelatie Kendall o: 


“A doilea soeka de coi a Si purtati ii cal. al ui Kendali, 
care este fundamentat pe numărul de „inversiuni” ale ordinii rangurilor celar 
două variabile, comparată cu o ierarhie standard (Porojan, 1993). De Gbicei, 
ordinea standard este ierarhia egngbiles X, în fine, de care se studiază 
i inversiunile din ierarhia variabilei Y... E TE A 
cy „Calcularea acestui coeficient (ri se citeşte tau) n nu pune di asemenea 
f condifia de normalitate a distribuţiei variabilelor, însă cere observarea tuturor . 
cuplurilor de variabile (Y, XY) cu î3f]. Observarea acestor perechi este 
laborioasă, deoarece este nevoie de considerarea a [MN-D/2 valori. “Fiecare | 
pereche conţine patru ranguri: X; Xs Y, şi Y. “Coeficientul 7 este în esență. 
ecartul dintre proporţia perechilor căii danie: şi proporţia „perechilor 
discordante. O pereche este numitá concordantá dacá atunci când X,>X, şi 
-= Y> Y; în caz contrar, perechea este numită discordantă (atunci când a 
Y, <Y, sau atunci cánd X<X, y> Y) 
| „Pentru calcularea Oradiei şi ERNE (deci 
E inversiunilor), se procedează astfel: se numără în coloana Y, de sus în E 


_ în ordine, câte valori mai mari decât numărul considerat se află până la 


sfârşitul coloanei iar valorile obţinute se trec în a treia coloană (vezi tabelul). 
Astfel, primul număr din coloana K a inversiunilor, respectiv 38, 


“seranifică por a sapă prima “cita ia i] 
coloana Y (2) sunt 38 de valori mai mari decât. | 
2. A doua cifră dig + coloana K a inversiunilor 
este 36, ceea ce înssamnă că sub valoarea 4 
“din coloana Y sunt 36 de valori mai mari 
„dece 4, etc. 

> În. continuare se Estat proporția “i 
“pi diin perechile concordante şi fu E 
- discordante, Br următoarea formulă: + că 


IAN au. 


rajo pa: cosa e d : 


Ne CE ' i e ; 
“a; US A e PUT ER Pos! e ne. A 
A: bir EE 


o 1330-1700 « - 550. 


ta acest moment se batul aplica formula la de 
„ calculare. a coeficientului Kendall Dl Lo 


ES e E 
PI 0 


PENA A a m id ; 


 Coeficienitil 3 arial tot e. “ai iai | 
; sa fiind în general mai redusă decât ce a lui p. W e 
„Dică toate perechile sunt concordante, 7= +1 
„iar dacă toate perechile sunt. discordante, T=- 
<1 Nu există corelație. între ranguri (7=0) “| cata 
“atunci: când numărul perechilor . nte Me 
„este egal cu cel al perechilor concordante. | curga 
| - Semnificaţia coeficientului 7 se poate | kaim- 
verifica: cu ajutorul tabelelor speciale Kendall, i Fens 
“ însă, deoarece distribuţia sa tinde rapid spre Accor 
„cea. normală (Beguin, 1978), dincolo de {5 
NS 10 se poate testa ipoteza nulă rad, ati ka 
„ajutorul v următorului. testini Pan 


s ZA | 
| 25] 
1.26] 
1.014 


EN 
„28| 
“08| 
16| 
324 
21 
feri | 
BI 
21 
194: 
„294 
31 
Bf: 
36|. 
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i îsi VON DS . a aa aa îi plita a : | 
„cu 1 respingerea a ipotezei n nule ENA dacă arata la a-0, 05. 
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5.5. Músurarea relaţiei dintre o caracteristică cantitativă şi una 
calitativă nominală sau dintre ea: caracteristici calitative $ 
B nominale i | 
| Unele [lobul pri Bi ri nu 2) fi exprimate decât prin interna hol | 
y codurilor nominale, în general binare ( zero si. unu). Astfel, în studierea 
echipáni. tehnico-edilitare” a localităţilor. unui. teritoriu, „se notează cu 1 
prezenţa unui anumit echipament (de exemplu alimentarea cu apă) şi cu O | 
absenţa sa. În cazul acestor variabile, nici una dintre metodele prezentate. 
- anterior de măsurare a corelatiilor nu pot fi aplicate. Există însă anumite 
„metode de “măsurare a intensității relaţiilor stabilite- între fenomene 
_ caracterizate de variabile nominale, printre care cele mai importante sunt cele 
de calculare. a coeficientului. iih ye > corelaţie, sia coeficienţilor de 
asociere. AS S pe | s i 


o 5. 5. L Raportul a empiric ; de corelatie o. 


a : Reporta ti empiric de eiii 7 (e dicto ela) ar de 
| maximă a: relaţiei existente fie între două caracteristici cantitative, fie între o“ îi 
. caracteristică cantitativ si unul calitativ. În calcularea : sa se porneşte de la un 
„tabel de contingenfá, deoarece este strâns legat de distribuțiile marginale i 
- conditionale”. | 
i ‘Spre deosebire de coe eficientul de dotați Bravais- Pearson, 
coeficientul” n: au necesită. ca relaţia să fie liniară. Din această cauză, şi 
"datorită faptului că nu oferă alte informafii asupra naturii relaţiei, este necesar 
ca, în cazul caracteristicilor cantitative, su fie insofit si de analiza celor două 
curbe de regresie (Beguin, 1978). Prin urmare, în cazul. caracteristicilor 
cantitative, trebuie calculați. ambii coeficienți: Si Nyy (al lui X în Y), si nm (al 
dui Y în A). În cazul în care. Y este ` o caracteristică calitativ nominal, „se 
calculează doar Mr | i 
„Deoarece ars un caii similar indicelui Bravais-Pearson, ; 
pătratul său (y?) are aceeaşi semnificaţie ca r?yy, măsurând partea de varianţă 
explicată din varianta totală. Mai exact, 7? este proporţia variantei distribuţiei. 


y ' Vezi subcapitolul "Tabelul de contingentă şi studiul relaţiei între două caractere discrete”. 


=. marginale exprimată prin varianța 


itior distribufitior condiționale (Calot, 
1973). Expresiile celor doi coeficienţi de corelaţie empirică, exprimati piis 
= potret: rai sunt: 


ES FE HA 3) să: 


e pal PI îi ai 
E Pa = 1l- aa 


| pentru corel jui ri în Xx “Raporturile, EEN Hoiatan de la un: , tabel 
- de contingentá, pot fi calculate numai cu condiţia ca raportul dintre numărul 
de clase (N) și efectivul t total. a tabelului Y ) să fie! mai mare sau eee cu 
1450: a E Y a T apa Gi 


s. 5. 2 Măsurarea. rai « dintre două caracteristici calitative f 
| Măsurarea intensității i relaţiei stabilite între două esni ilitata ; 
de nominale nu poate fi efectuatá prin calcularea raporturilor sau a coeficienţilor 
'de corelaţie. Metodele: utilizate î în acest caz sunt tot metode neparametrice, 


dar care caută să măsoare nu intensitatea ci gradul de asociere porat 
| Sparial iy farl geografiei) al celor două variabile. | | 


i cui e Exemplu. Ştiindu-se că litiul este un arbore iale i de 
a regimul epi, a se esla încerca să se demonstreze. că ap de 46 


PA = a F 


Te 1 Vezi subcapitolüt "Tabelul de contingentá şi studiul relației dintre două caractere discrete”. 


- 7 Sl E E r ae a ¿A Ts A e ` . LF 
LAA RE E A A ENE A AS a E 4 A 
oră PI AIE mie! A A A AT tes F : 
A OP ai a e a a AA A 
F . 


atitudine nordică e este în ai dă (mu ca pi af ms A ES TE pr ga | 
prag bioclimatic pentru aceastá planta. reda si ani g m aa PA ana | 
unor date teritoriale amănunțite se construiesc 4 ETER E 
a două. variabile X gi Y, în care X semnifică | 
producţia judeţeană de. piersici (notată cu O | 
pentru judeţele cu producţia sub 500 t/an şi cu | Si: 
1. pentru judeţele care depăşesc această MA 
valoare), iar Y semnifică poziţia fiecărui judeţ | Tm iţi: 
în report de paralela 46°lat.N (notată cu O m |. 
pentru judeţele. netraversate de paralelă si E: amr, i 3 AN PE 

Musnez 

Neang 

Dâmboviţa 

Hunedoara 


ii 
a. 


r Le NS 
ón: PE 


> ai 
ES aa e 


i y i 


aflate la nord de aceasta şi cu 1 pentru 

județele traversate de paralelă sau aflate lasud | 
de aceasta). Tabelul : iau ou i coală este 

redat alăturat. | Hunedoara |. 
“Pentru a se Ga gradul de asociere — |. Marime: 

(a prezenței acelorași valori ale celor două T D 
variabile în acelaşi județ) este necesară | Sibiw 
realizarea unui tabel de contingentá (vezi. | E 
tabelul de mai jos), deoarece toti coeficienții | ` 
de miisurare ai asocierii au la bază noțiunea 


de contingentá (de asociere) şi legea urmată | Ala 
de y | | “m. Satu Mare 


ES Esi = apa a a e aa : AS NE 

: EE » O y ZO RA O 
= ra IS Da E re e a ES A amo el tea 

Ra ba pîna CDs a pap îm O Q- QO OD. == e. 
sos A m SA i ; Ese ca - ai ENE ` e ne: 


mmm D e O iie O i S On Oa e 


Sonno onoono os 
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es má = a 
a es i = i £ 


O = a 


ii AA d. (se citeşte mM este. de fapt oaia de e corelație 
iniară ră Bravais-Pearson aplicat variabilelor binare (ale căror valori sunt notate . 


> N 


cu 0 şi 1). uleiul sa răi posibilă i numai ice de la un tabel de 
i h. 2x2 e două linii x cu două coloane). Formula pe calcul este 


i TOPDA Ru kakyn" kay) 
a qna 


Sau pai 
D. 
Pr B — 

q... 


E ÓN O e a d ine tea 
ei o i > = 0 SM o 
SA A d ds ¿EAS FE A a 
. Pe Ai ii ia À PAS AI $ F piere NS: 
e e pu E dl A ES e 
E AAA A E A ri 
pg. ` e e z EERE RE dag ca a 
3 e AA ., METE EN z wog E 
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| sea a A K Ba Pk D» y da ză -$$ 4 22 patrie e 
a ar ai MA DES „tel dai ook e pl ai op da pupa 
| te N este efectival total cs N= k J. Din tabelul de PE NE se obține 

2.=24,3, de unde $?=24,3/40 =+0,607 => $ = Vo= +0,779. 
Eau, coeficientului, $= +0,779 confirmă existența unui grad destul de 
nare de asociere între producțiile mari de piersici obținute A $: 
poziția la sud de paralela de 46°lat.N a judeţelor României. .... .. 
Coeficientul g se dovedeşte semnificativ sau nu după testaren 
ipotezei nule H, conform căreia p=0. Atunci când X’rr ZX? Ho este . 
respinsă. În cazul exemplului numeric de mai sus, coeficientul se dovedeşte. 
iti e a sl la a=0, 001, RS, citit este de 10, 831 a “remos ! 


>. 


] ` Coeficientul. de. asociere o (se citeşte. W este goia apropriat ` 
studierii relaţiei dintre două variabile binare. iu calcularea sa se e pupa de 
- asemene de la un tabel de contingenţă 2x2: | | 


i su aaa , ki ii E 11-16-1093 16-10-3 - = 40,708, 

E Sl Ka "kot a a 11*16+10+ 3. ji 
A dd de fundamectat po des Că produsul h,* ol relicfeazl" 
gradul de realizare al asocierii, pe când. produsul k;y*ky evidențiază lipsa 


E ea ir 


OS 


ia E anetarit si i Mateaeiai; e oscila ază între E şi. 
fiind dat de diferența ku * Ån - katka. ds | 
~ dacă kyt ka > ka? eks. atunci e Maa 
za: că a dacă LA să < kit karv. atunci e<0 3 SA 
“Tpoteza 1 nulă Ho conform căreia 8 = 0, se: testează a prin calcularea 
lui x 2; dacă x mxo atunci ini este e. | Pia 


Spre. deosebire de ceilalţi tilcieal. c'se, i pia sita tabelelor i: A 
| des coming mai mari de En însă e n sa statistică : se se sprijină | 


= m ch BZES ya 
| | xN A, 24,3+40 + RS pio Ad 
a Coeficientul de asociere c este întotdeauna pozitiv, oscilând. între 20 şi HL | 
“însă distribuţia. sa statistică nu „este determinată,. din care cauză trebuie 
“calculat raportul dintre valoarea sa. obținută. prin „formula de mai sus 
E e +0. 615) si valoarea sa teoretic? maximă Cra), rezultată din 


1] ` +0, 615. 


în care m 1 este pp VA mai mic, fe de coloane, bé. de rA al tabelului 
- de contingență. De exemplu, dacă un tabel de contingență are 5 coloane şi 3 
linii, m=3 (în cazul nostru m=2, deoarece numărul de coloane este egal cu 
“numărul de linii, PROA cu 2). Calculând aportul, se obţine | | 


Al 24 3 e ai 
Cxr 74,3 +40 DÍA e ek 
„= = | ? i AN r +0,869 


SĂ Pe aiii coeficient +0, 869, care denise o puternică noii 
fl + între eta. sudicá a județelor şi mărimea producției de Ia g se yeto 


152. 


ipoteza nulă c/c, = O, care este respinsă dacă xXx ZX. 


Coeficientul de asociere r., a cărui distribuție. este Ple E 3 
nedeterminată, se calculează ca un raport între x? observat şi valoarea 
maximă pe care o poate: avea x? observat, care se află Prin X'ma = N(m-l), 
în care m este cel mai mic număr de linii (de coloane) al tabelului de 
contingentá. Formula sa de calcul « devine astfel: | 


| AS = 40,779 
| 40(2- 406-1) 
i Se remarcă -a faptul că în ‘cazul tabelului de contingentá 2x2, m-l = 2-1 
"= 1, încâtr, = q, egal în cazul exemplului numeric cu +0.779. Semnificaţia 
coeficientului este “obținută prin testarea ipotezei nule Hp, cu r: dacă 
i Ar > x2,, Hy este respinsă in favoarea ipotezei alternative H, conform căreia 
i cita o Că deoarece coeficientul lui € Cramer oscilează între O. şi +D. 


- Numărându-se printre cei mai comozi i coeficienți, deoarece oscilează 
între; 50 si. +1 coeficientul e: se bazează de asemenea pe calcularea lui x?: 


Peeri = = 0.79. | 

sri acele Mali. 40y(2-1)(2-1) E 

| dede y = an mp, cu My fiind numărul de linii şi cu m, fiind numărul 

de coloane al tabelului de contingentá. Se observă că pentru un tabel de 

| contiagenfá ps a, y = (2-1)(2-1) = | 1, de unde rezultă căC=r,= G şi egal 

în cazul nostru cu +0,779. 

¿as Testarea ipotezei nule Ho, conto căreia C = 0, se face la v=(m,- 
1)Gn,-1) grade de libertate pentru un tabel de contingentá mai mare de 2x2. 

in cazul de in al tabelului 2x2, »=1; pari nulă H, este ere gi dacă 

ho x’ EX e iar a A 


5, 6. Corel şi canzaltate 


Stabilirea fp existente unei i legāturi între două fenomene nu 


153 


implica în ine necesar că git cele două iona există! i relaţii “dai 


_ cauzalitate. Există şi corelaţii aparente, fără fundament real. Britanicul G. U. > 


Yule a stabilit că, între 1929 şi 1937, în Marea Britanie valoarea i 
- coeficientului de corelație dintre numărul de receptoare radio şi numărul -. 


deficienţilor mintal a fost de +0,988 (Porojan, 1993). Este evident că, 


dincolo de aspectul amuzant, nimic nu îndreptățește existența unei corelaţii . 
| reale între cele două variabile, ue ¿AN 


5.6.1. Posibilităţi de paca e a corelaţie | 


PARE geografie. se observă Bb inuito cui îi Don variabile find a să T 
asocieze spaţial. (creşterea sau scăderea valorilor uneia în unele unităţi 
teritoriale este însoţită de creşterea sau de scăderea celeilalte în aceleaşi 
unităţi spaţiale). Creşterea sau scăderea simultană a celor două variabile nu 
înseamnă nici că una are o influență directă asupra celeilalte, dar nici că 
_ această influenţă lipseşte. Covariaţia lor spaţială se poate datora foarte bine 
„unei cauze externe, care le influențează pe ambele în acelaşi timp. De 
| exemplu, reducerea ratei şomajului poate conduce atât la sporirea economiilor 
- bancare a populaţiei (X), cât şi la creşterea consumului de bunuri (Y), deşi, 
"aparent, între X şi Y există o legătură cauzală directă. Se observă apte că - 


o..." 


| laică mai multe poria de 2 a or 


e 2 Cautin directă - i | i 
E Reluánd exemplul corelañal dilo rate analfabetismului fetita din 

| alei tropicale şi rata mortalităţii infantile masculine, cu rar = =0, 820, se pot; | 
F stabili două explicații cauzale ale dependenței: Rh 

„iuti Analfabetismul este cauza mortalităţii infantile ácido i Sa 

E femeile analfabete nu pot citi lucrările lui Freud, Brazelton sau tratatele de 
Ti medicină din biblioteca din localitate, ele nu ştiu cum să-şi îngrijească copii. 

RA Mortalitatea . infantilă: masculină este cauza analfabetismului: 

2 deoarece moartea băieţeilor aduce la disperare tinerele mame, acestea renunfá 
W să mai înveje să ames  Iucrăriie lui Freud, ale lui Brazelton sau tratatele qe ; 

ali au) Este clar astfel că iul cauzată d directe este greu d de detectat n 
4 nes altor añalizo. A AR RE 


E -Danta ri. cauzale. liniare 


EE M y . 
PERO E e WAN ` : e i 
Se . P-e: 3 > A e 

PE a y e k, N Re 

E i .* ii . e A mm. - 

o Di dz = E e e zz 

eel ie & y 
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În zaa exemplele de. mai sus sunt de fapt lanțuri cauzale, si nu | 
relaţii cauzale directe: | 
E * Existența focile: era fata a > face jatir iei vita > 

rezultă că femeile nu pot accede la informaţii medicale și de psihanaliză = > 
din care cauză: copii sunt: prost îngrijiţi = fă cesa ce duce la creşterea R 
mortalităţii infantile masculine. | 

„* Mortalitatea infantilă masculină mare = > O femeile sá 
se instruiascá = > deci ele nu vor putea avea acces la tehnica citirii şi scrierii 
e - fapt care. duce i în ultimă viii, la Poe ratei anal: o: 


Bag a on prep ui 


p < Este foarte posibil ca unul dintre cele două caracteristici să nu Pa | 
| decăt un factor printre mulţi alţii care îl influenţează pe celălalt. 


| > Apalfabetism Er Sa -> mortalitate infantilă 
y 13 Malaia ole do a ES -> mortalitate infantilă 
eat CUE: sti all daia .-> mortalitate infantilă 
vaz Lipsá asistenţă medicală ->....... “> mortalitate infantilá 
SI . ai i Constrângeri culturale > analfabetism feminin | 
fics i -Lipsá asistenţă socială ->........=-> analfabetism feminin 4 
> <u Agricultură de subzistență - > .....-> analfabetism feminin 
aia Morjalitaje; infantilă - Denett -> analfabetism feminin 
ai p Pa pr tag 


S - Covariaţia spaţială a a celor două variabile pac fi cauzatá An un 
na factor coni; exterior: E, 
Eo | - Subdezvoltare -> „eds tute infantilă 
 Subdezvoltare - -> analfabetism feminin 


i ale În unele, T covariația celor două fenomene este guvernată de 
as circulară. stabilită între una dintre variabile (de exemplu X) şi o cauză 
Es externá care Suez indirect a doua variabilă eră 


E LAA | 
d Subdezvoltare i; 7 Analfabetism feminin <—> Mortalitate infantilă 
a ea 0. <= is 
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ri Sistem cauzal - get di o A 
„Apare evideat faptul că i explicare iat a unei i corelaţiei esti | 
= dificilá dacá cele două caracteristici sunt considerate. izolate "de restul 

“realităţii. Este nevoia prin urmare ca relaţia dintre cele două caracte rist ci 2 sd 


fies studiată î în o sistemului c cauzal î isi care ele evoluează: 


y | ` sistem VOR id Vol a NA 
Meri < <= pin SUBDEZVOLTARE <= => > heat feminin | 


5.6. 2 . Coreati ș si prezicere: s parador oral în ygi” 


“Deşi este miile pia spiritul uman, nu este oidini ; 
_ necesar să se înţeleagă pentru a 'se acționa. Să presupunem. că se observă ©- 

corelaţie de +0,989 între zilele când purcelul poartă paie în gură şi vremea: 
urâtă din zilele consecutive acestui comportament: Bineînţeles că se poate - 
- cerceta şi analiza sistemul cauzal care explică legătura € dintre comportamentul | 
- animalului şi vreme (presiune atmosferică, umiditatea aerului). Dar, chiar 
dacă acest sistem cauzal ne rămâne în totalitate necunoscut, în cazul î în care 
_corelaţia. este într-adevăr de +0.989, nimic nu ne poate împiedica să 
| prevedem cu exactitate starea timpului din ziua următoare celei în n care. 
observăm purcelul cu paiul de rigoare în rât. B 
Aserțiuni de genul „cum îţi aşterni, asa. dormi”, “de la Sfânta Mărie 
poți să uiţi de pălărie” , „la pomul făudat să nu te duci cu sacul” , „nu da. 
- vrabia din mână pe papagalul depe gard” sunt corelaţii empirice care nu sunt 
" întotdeauna explicabile dar care, dacă sunt puternice, se iti dovedi utile în 

| cine de er a fenomenelor. | | 


Pay 


Ra 


5. 6. 3. Un pericol specific geografiei: e eroarea aceleia 


An P A studiul doriis se Mosa de vel mai lia ori, i, prin a 
intermediul analizei unei mulțimi de locuri. Atunci când variabilele utilizate 
- în analiza acestor locuri sunt variabile sociale, care descriu locuitorii locurilor. 


respective, trebuie să: se aibă permanent în atenţie faptul că o corelaţie 


stabilită la nivelui locurilor nu implică în mod necesar 0 eri la 
- mávelul locuitorilor. lor, | PR Cas 


Pi 


E, + Exemplu: Cipla si aii în ‘Albeni. > | 
A Un studiu sociologie (la nivelul indivizilor) deriomstepază că rata 
criminalităţii î în oraşul Albeni este mai ridicată în rândul autohtonilor (36%) 
decât în rândul străinilor (7 %). Cu toate acestea, un studiu geografic (la 
| nivelul. cartierelor) demonstrează o corelație perfectă (r = +1) între 
proporția străinilor în cartiere şi rata criminalităţii în cartierele respective. 
„Nu este vorba despre nici un paradox: prezenţa corelafiei la nivelul ` 
„. locurilor semnifică pur şi simplu faptul că acolo unde sunt mulți străini sunt 
de asemenea şi mulți criminali, dar aceasta nu dovedeşte că străinii sunt 
autorii actelor criminale. 
Acest tip de eroare este numit eroare ecologică, deoarece ea constă 
na gándi cá prezența a două fenomene într-un acelaşi loc (într-un ecosistem) | 
J implică o relație cauzală între cele două fenomene. Însă faptul că leii şi 
_termitele trăiesc în savană nu implică deloc faptul că leii mănâncă termitele 
Sau că termitele rar de zor leii ha savană ra sai asigura cina.. 
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e a i . - 
5 A . Pr: E X 
Mha ar E . 


doine das é 1. Def nie 5 şi termeni 

A a MEG anterioare distribuțiile sı statistice au fost considerate ca 

ri o anumită stabilitate a structurii interne (de aici denumirea de de 

„statistică de structurá ” pentru ansamblul metode:or prezentate până acum); 

sau, în orice caz, nu ne-a interesat. modul de manifestare în timp a acestor 

distribuții, n-a fost urmărită evoluţia lor în timp. —Considerarea explicită a: 

“timpului drept caracteristică î în funcţie « de care sunt repartizate + valorile unei 

„variabile constituie semaul distinctiv al seriilor cronologice. 

Ad Seriile cronologice (s. de timp, s$.. dinamice) sunt acele 
distribuții statistice de o vai iabilă la care modalitățile 
(valorile) caracteristicii sunt ordonate în raport cu timpul. 

“Din această definiţie reiese că o serie cronologică presupune, de fapt, o. 

distribuţie a populaţiei studiate, după două sa ea dă dintre care una este .. 

| întotdeauna tiinput. ; 


al exemplu la indemáva este cel al tabelelor me vteorologica, in 
i interiorul cărora valorile elementelor meteo sunt ordonate pe zile, decade, sau 
luni, Populaţia temperaturilor aerului, de exemplu, este repartizată astfel depa 
două caracteristici: una dintre ele este timpul, iar cealaltă, ale cărei modalităţi. 
“constituie chiar datele, de observaţii, precizează felul temperaturii (ex. 
cuie la ora 7, temperatura medie zilnică, maxima diurnă etc.). a 


de felul acestă fii devine o veritabilă valib, în funcţie de care 
„se poate analiza comportamentul celeilalte variabile. Acest fapt este confirmat 
Di şi de modelul matematic gale e al unei serii aria o - 

„în care timpúl joacă rolul de va siabila independentă. Siral de valori al seriei. 

| va avea dis ad generală: 


T | Ye Ye Y. ees Y,, | 
Trebuie subliniat, însă, că î în cazul seriilor cronologice tizapul constituie c o 


pu 158 | 


“amiabilă tă: (Chadule, >. 1974). care nu 0  infiuenjează îe tan nici un a fol W 
` esalaltă, ca având doar rolul precizat in definiţia. en mai mis: acela MĂ criteriu w i 


e. deta a. valon ik ai Secas iuni a iii ca a a “ati 


BR =De e AN variabila til se apa vilct cs ea se unor y 
y into temporale echidistante; ore, zile, luni, ani etc, Întrucât la intervalele.. | 
mai mari de: lună echidistanta mi éste perfectă (există luni de 30, “dar şi de 
31. de zile; există ani. bisecți), :se obişnuieşte, atunci când se consideră 
~ necesar, 0 corectare a valorilor variabilei! pentru a asigura 'comparabilitatea: 4 
i Coeficienfii- de corecție se "obţin: 'raportând numărul de-zile dintr-o lună 
+: medie” (365/12, sau 366/12) la mimărul de zile al lunii respective. În felul . 
acestă pentru o lună de 30 de zile coeficientul de corecție este 1,013 (1,017 
“ pentru un an bisect): pentru o Tunú de 31 de zile coeficientul este 0,981 
„„: Crespectiv 0,983); penti, luna, februarie coeficientul este 1 „086 (respectiv j: 
SAD i a 
wa a y După felul în care idile Ain se ati as : ară vilo de timp | 
$e disting două feluri de serii cronologice: - --: 7: 
A e s. de momente — sunt acele .5.C. 4 care: vaie teii (de 
regulă una de stoc) sunt atașate unor. momente de timp, eventual echidistante. - 
O. caracteristică a acestor serii este imposibilitatea (sau lipsa de sens) a 
„ cumulării valorilor succesive. 'Exemple de variabile: populaţia unui oras, 

E: parcul de automobile al unei ţări, populaţia ocupată în agricultură ş.a. 
pi “es. de intervale sunt seriile la care valorile variabilei (de regulă una 
de flo) sunt ataşate unor intervale de timp egale. Exemple de variabile: . 
$ producţia agricolă sau industrială, cantitatea. anuală de precipitaţii, nr. de 

- ; născuţi vii etc. O. asemenea serie de timp mai este numită şi continuă, + 
. deoarece variabila poate. căpăta un număr infinit de valori în interiorul 
` intervalului temporal ales. Caracteristica. acestui tip de s.c. | o constituie hs 
-R posibilitatea. cumulării valorilor. succesive ale variabilei. A $ 
| Reprezentárile grafice specifice pentru s.c. sunt pacas i sau 
historiogramele. Acestea sunt nişte grafice simple de tipul curbelor - 
elementare, în care pe abscisá se trec momentele/intervalele de timp, iar pe 
i ordonată va) variabilei: mm. ce o. Pa” de valori 100 jir. 


) A ; A Pa aici şi mai departe. în- text inoate variabil” se referă exciusiv la variabila y din | 
>s cul m mai. us, a cărei valori constituie termenii seriei cronologice. 


. G re” 
y E z i TE] 
AS 3 A 
. E . îi 
d A ¡al 
- 
: 


< se uneso printr-o. ess rezultând 9 curbă care descrie ic ta timp a E 
fenomenului audiat : i ue il ESTA a is 


L 2. Serii y oronologice ni indi 


TS Mai aks Ardi Statistici econoraice, liza ii e seriilor: 
-dë timp se bazează pe un sistem de indici care caracterizează succint relatiile * 
cantitative dintre termenii seriei, pe o anumită pontada sau pe oe Mi] 
. interval de timp acoperit de termenii sérici. | 
„Un indice este un mărime numerică rezultată din ás 
| Air area valorilor unui indicator statistic şi care oferă 
-o măsură a schimbării nivelului unei variabile în timp 
d (indice cronalogic) sau în Petit (în ndice teritorial sau 
i TERE, | | Y | 


| Potiiizisria lati unei serii sau subserii cronologice permi te 
Mi SA a trei categorii de indici: absolufi, relativi si medii (Porojan, 1993). 
Indicii din primele două categorii mai sunt cunoscuți sub denumirea de indici 
| elementari, iar cei medii mai sunt ds indici sintetici [Eractulos49124). 


| e a)indicii Magi E sunt acei indici ai cáror valori se elisa în 
3 aceleaşi unităţi ca şi termenii seriei. Dintre indicii absoluți mai uzitafi sunt 
„trei: nivelul absolut, sporul absolut şi, pentru ser tile de intervale, volumul 
sporului. | 
e nivelul absolut al. seriei reprezintă, de fapt, ines valorile absolute 
| ale termenilor acesteia: | 


| Yp Y RA RT oi | | | 
E un sporul abioj sau creşterea absolută este diferența ARE un 
termen oarecare al seriei şi primul termen, acesta din urmă find considerat 
4 bază de mkpg motiv Pap care se mai pag si spor pea cu bază 


des AAN A márime 4 statistică, cu ota căreia se i aut u ug i deal i 

© social-economic sub aspectul structurii si modificărilor sale cantitative în timp sau în spaţiu 
Trebici. & colab.,1985). Exemple de i.a.: „ Venitul national, valoarea palo ind: mule; a 
consumul de calorii pe cap. de locuitor etc. "A 


La $ ra E 100 (pentru întreaga serie e indicele va 5 la * 


e. a pa 2. 
. A a a y 4, 
. ott e PETE ea 
; da qe 


so Sporul absolut al tnvegi se serii va afi at dintro ultimul. si primns termen: 


n pona oo pont cet lo o at doi wape 


7 ce onseoutivi, caz în care se prat ee aoin cu pod în a 


e și ai MERE de add i ALL în PEN variabilelor ate căror or 


! | valori se 28 pot ile) se calculează elos T perle: NG E: 


tb Ban i e Ea 


~ byindicii relativi - — sunt indici care se chin sub. forma unor 


i rapoarte, de obicei procentuale. 


See am ena indicele, de crestere,» ob ua port inte un ` 


“termen oarecare al seriei si zi termen, e A ca bază taie de 


cregtete qe: papă Jig). 
A x400). 
Je 

Fag aici n ieina da me e t ei 


| ta e cai soriilor E nidad, între cele două feluri de indici există h 
o relație care derivă din modul cum se calculează aceştia: indicele de creştere 


Cu po o este egal cu ea indicilor «y cea ¿ed cu bază în Je 


= «Hu > e | 4 Y: 


. rm. spor este dat de raportul a dintre volumul T şi AE 


ERO Exa 100 = E ati aaron 
rii sa Pete aj 


şi a câte unităţi lero de spor. absolut revin pentru o unitate 


(Procent) din bază. Lucrând cu perechi de termeni succesivi se pot obține şi 
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eE Pta. F 


Ta aritmetice ale seriei cronologice. 


i e nivelul mediu se calculează 1 în e iea Hat cum avem dea. 
| fac e cu o serie de intervale sau cu'D serie de mormente; echidistante sau nu... 


— la seriile de intervalo nivelul, mediu e este „media, aritmeti că | simplä a a 
E termenilor s seriei: gat E a 


x AR UN A, A TA on A e PA RA 41 Y S 
Mi ARA A TNS poze 3 ; n Sa i '. | > 
E e A, AE a AA E i KERN È vis 


F tab l seriile de momente. s echidistante nivelul sodiu e este > media cronologică. 
| AE, a EZ EA 


cd 


cita da soriile de didici ce se HINE A la intervalo de timp > inegal nivell 


y A mediu e osie o media cronologiei ponderată: - E O IE AA: A 


ta i SS CR tit, 
i iii ci 2. An A ji 2 


x i s a $ 
Boi 


BA ETA inta, 


À vad și din „ii di sunt intervalele de timp (nege) a dintre momentele de timp 


i} ale s seriei. 


absolute cu pa fixă, sau cu u baza Î în Rei la numărul deget minus 5 ul i 


mint 


3 De TE e, suma 'sporurilor absolute medii cu baza t în n lang este egală o cu i 


e sporul absolut mediu o cu bază fiză:, 


a, ao E Ba. ES As 


isi 


PA cjindicii medii i Gintetici) — - sunt t de ipt niste variante de medi 


E dado ¿E ESO >, és, G 


AS peo da le AA Po ei ri "= a - wra E 
nii É T ARES . i . n nE; $ 
tes tă na a e e Eyr A i f "DOK CA A o. Maei ar 
pr e. o a - A æ sae, .. se: : Vi k e- 
. NS Ñ 47 a 4 Erin O ut . 
` i "sa Sei ` . . a. > i bat. SĂ Llera + ei 
A: NES i 


0 poes botas edad! se lin prin a raportarea. Dorini 


À TA A 


e o ritmul s sau u indicele mediu « de creştere se determină, de reguli, ca 


udă 


medio sar a cidis de stil: cu baza 1 în tan, însă, dacă tihem șa 
t de relaţia dintre indicele de creştere cu baza fixă sic cei cu baza î în E taa; 
obtinem O formulă de calcul mai Pompilio : | 


| “Trebuie REPE” că indicii unei serii “cronologice, A în a G w | 
indicii de creştere, se calculează, de regulă, atunci când seriile se referă la 
| fenomene care prezintă ritmuri de creştere cèrte şi relativ constante. De aceea 
calcularea ritmului mediu de creştere presupune un examen prealabil al seriei, 
“pentru a verifica tendinţa crescătoare. Odată calculat, indicele mediu de 
cr eştere constituie raza unei progresii geometrice cu acelaşi număr de termeni 
„Ca şi seria analizată şi pentru care, dacă se cunoaşte primul termen, se Be 
calcula AE ceilalți termeni: | 


e... AA Yao Ye La yes, Seno 
Dacă ritmut de creştere este constant de-a lungul perioadei analizate, atunci 
“termenii | progresiei se apropie mult, ca valoare numerică, de cei ai seriei 
ri (primul termen fiind oricum identic). | 

4 „ Cunoaşterea indicilor de creştere este foarte utilă în inaltisite 
| comparative ale unor indicatori statistici, în perioade de timp diferite sau 
„pentru ţări (grupe de ţări) diferite. Este şi motivui pentru care indicii (în Pi 
| particular indicele de PEEN sunt Uzuali î în natie statistice mc on si it 
a internaționale. - sit: 

Ritmul pue de, lero: dde: util, Joasi hii în prognoza | 
i | iri la care se oferă, ao de Ape: e baza triana de 
f Bee matematică, 


rapi = O 83. Analiza senior cronologie 


i e pi n de dee. ia statisticii inductivo midi societ sn 
' cronologice prezintă unele dificultăți. „Acestea provin mai ales din faptul că 

“ valorile variabilei studiate, ordonate î în funcţie de timp, nu sunt întotdeauna 
independente; altfel spus, într-o serie cronologică. termenii, nu se succed 
- întotdeauna într-o manieră pur aleatoare, valoarea unui termen depinzând, 4 
pa mai quo sau mai = papo E de valoarea termenului eS pes 


ld Se taiata dese ie i BTD este aleatoare atunci ci 

de, - probabilitatea « ca variabila Y să capete valoarea y,. este 
UR „independentă de valoarea anterioară Y, «Chadule,1974). | “i 
Q serie nesaleatoare se numeşte serie organizată si. mao se saisies 4 i A 
prezintă unele aspecte specifice. A Pi „E 
În geografie se lucrează curent cu serii 'olimatologics. hidrologicó, E 


demografice, economice, Astfel de serii relevă, de regulă, o anumită: A 


orgánizara care se manifestă prin existenţa unei autocorelaçii temporale' intes - A 


termenii seriei. Într-adevăr, debitul mediu al unui râu într-o zi a anului mu 


poate fi independent de debitul mediu al zilei precedente; producţia de otel 
a: “României în 1995 este dependentă de hiena cagot, deci de: i 1 
nisa de e oțel, din 1994 pa oia a via ăi ay AAA Bu. 


6 3. 1 Verificarea a atar) c caracterului elăator ! 


. APN 


E y i = 
it A E, 
A DA 


AT. 1 il sau i corelagia oriali a unei serii citind tisa al {corelatie t i “A : 
termenii, vecini SA şi Ya) sau. separați de un număr oarecare de. intervale de. timp O şi A Rae 


~ai acesteia. Se pot calcula fte. coeficienti de corelaţie serială, analogi cu cel de corelatio fiară i 


~ simplă; lucrând cu şirurile de termeni pen cu k ranpa de imp o! pe de calota zu + 
„ete: aceeaşi: o dă f Me a 


ME O j O ei aaa caveătiă 
“le ta wir r este and între să si + Graficul având pe eje valorile pi E şi g PE 


za ordonată valorile lui A poartă denumirea de corelogramă şi este util în detectarea eventualelor E 


- fluctuatii periodice ale seriei cronologice ae ed lui a ce iti ar mob unui in apropiat de-l e E - do 
FU ERA tocmai wko paeo FAB: 


A E PERN 


E care e intră în categoria testelor statistice, 
r Verificarea caracterului aleator este o primă etapă, obligatorie; i în, 
ansliza unei serii cronologice, Dăcă nici unul din procedeele de verificare nu 
evidențiază existenţa unei organizări a seriei, atunci se COD: chide că aceasta - 


este pur aleatoare şi este inutil să continuăm analiza. Dacă, dimpotrivă; una 


san mai multe relevă caracterul non-aleator, atunci analiza trebuie continuată 
pentru ä obține, în final, un „ibode!” al seriei care să exprime cât mai 
adecvat modul şi gradul de organizare ale acesteia. 

Unul dintre procedeele numerice cele mai simple į ventru verificarea z 
caracterului aleator este testul: von ı Neumann (Cómo 7)» | să 
Se An mai întâi mărimea + 


| And Ei 
| Dacă seria este aleatoare, atunci ô? constituie, o bună estimare a dublului 
: Meco onto E Se calculează deci şi varianţa a”. Dacă 


il $ A] | 
| LEN i 
AN , 


atunci seria ts f considerată alea | 
y Dacă, în urma aplicării i von Neumann a rezultat caracterul 
aa non-aleator al seriei, © eventuală tendință de creştere/scădere în timp a 
AE valpo poste fi evidențiată cu qual testului rangurilor al lui dei 


Acest test ia , in considerare cogficientul. de 'corelația. a pad ME (p) al lui. 


E Spearman (vezi $ 5.4.1.). “Calculat pentru un număr-foaște-mare. de serii, p 


Eh constituie o variabilă aleatoare. care ppano o NE gizz A i 


E media Fab: şi varianfa: “o E | | 
e “Ipoteza nulă testată este aceea că hu există o dial th: cadrul seriei 
analizate. Aceasta ar însemna că pnu depăşeşte limitele unui anumit interval 
situat de o parte şi de alta a. mediei x=0, interval: care ar constitui astfel 
regiunea de acceptare a ipotezei nule Ho. Mărimea acestui interval depinde, 
| fireşte, de nivelul de semnificație œ al. testului: spre ex. pentru a=5%, p 
i trebuie să se afle în intervalul (tl, 96 ° a). Întrucât 120, coeficientul p nu 
| „mai i trebuie e standardizat şi poate 1 pa direct cu valoarea 1 1,960. Dacă 


Ty valorilor aoa fig. 6. 1). 


airi i. a. RA trebuie n respinsă ş şi se põie sich e căi în cadrul ele 21 există, - 
“cu. o „probabilitate | de 95%, o tendinţă a -cărei sens. (crescător sau : 
f descrescător) este indicat de semnul lui p. | | yu E 
Trebuie remarcat că testul rangurilor oferă concluzii corecte doat A 
dacă tendința testată este liniară. În cazul unei tendinţe neliniare, în speță | 
parabolică, aplicarea testului conduce la cimas i.n., ceea Cs constituie O 
eroare. 


„6.3.2, Descompunerea (filtrarea) seriilor Putini | 


Examinarea atentă a graficelor unui număr mare de serii de timp ce 
redau fenomene naturale 
sau social-economice. ne. 


„va conduce, mai curând SR < 
_-- "Teadita generala (tren 


a nai târz 1, la ideea „Trend + variatie ciclica. PE 
că în cadn.. unei serii se. |... : E “a i ei i n sezonieră 


„poi deosebi. mai multe 
feluri de fluctuații 
(mişcări, variații) ale 


și tendința | 
E EET, sau, cu un |... 
__ termen englezesc să je rr a. oil teară OR E NAS SR 
ll încetățenit si în limba Figura 6,1. Componentele unei serii cronologice 
română, trendul - seriei „şi Pegatireile de combinar e a acestora. 
€T). Este acea variaţie | 
; lentă; constantă şi de lungă durată care indică direcţia generală de evoluţie in 
— fimpa fenomenului studiat prin intermediul seriei respective. Se mai numeşte 
şi tendință seculară sau trend secular, deoarece in date se ee, o 
perioadă îndelungată (zeci, sute de ani); | i 
kom E variațiile ciclice (0. "Termenul clica? dedicata aici “acele | 
fluctuații cvasi-periodice ale căror amplitudini şi perioade sunt mai mult sau 
„mai puţin neregulate (motiv da care ele sunt incluse u uneori în categoria. 
E variațiilor rara En E A e ) ) | 


. ră Y h E . A As ii A pe s . 
E , - 0 ci e TOR a k 


Si e -variațiile nia, S: “sunt i, Variaţii care se repetă, 
E aproximado! în aceeaşi formă, la intervale de timp (perioade) egale. În funcţie 


EE de mărimea perioadei : pot fi mişcări diume (ex. oscilaţiile diurne ale 


i temperaturii : aerului), semidiurne (ex. oscilafiile mareice), lunare (eX. variaţia 
„ consumului de alcool într-un cartier. ra iaa în sd cu deta fixă a 
- chenzinei) sau, cel mai adesea, sezoliere; = ; ul 
| e variațiile aleatoare sau a tea (R), care se df unor ` 
factori cu acțiune aleatoare (ex. calamitáfi naturale, calamități politico- 
administrative etc.) Ry care formează apoutyih „zgomoí” ai unei serii 
: cronologice. | : 
Orice serie reală rezultă din kr] sau mai bine spus ia 
compunerea acestor mişcări, ca o consecinţă firească a acţiunii simultane a 
factorilor generatori specifici. Se consideră că există două modele de 
„ combinare a celor patru componente, astfel încât să rezulte fiii ete | seriei € 
reale: uri 1400, 
a) modelul PN care e presupune că factorii ohiari sunt independenți unii 
as sia nireng lor insumándu-se pentru a da valorile seriei: 
| i cos o "T+C+S8+1; | | 
E D modelul intiliplicadi care presupune că factorii generatori interacționează, 
„astfel încât între poten E + celelalte există o relaţie de 
3 proportionalitate: | SN MAE 
| y = T Xx c x s X R. 
«Decio sau filtrarea unei serii cronologice constă în izolarea | 
componentelor de mai sus pentru a le putea studia mai bine şi, eventual, 
pentru a le elimina. Izolarea unei componente se realizează prin metode de 
_ ajustare (engl. fitting) a seriei, adică de înlocuire a valorilor reale cu nişte 
< valori calculate cu ajutorul unor modele grafice sau analitice. Ajustarea are 


ca rezultat netezirea (engl. smoothing) curbei corespunzătoare, care devine 


- astfel mai regulată şi evidenţiază componenta. care trebuie studiată şi, 
eventual, eliminată. Izolarea şi eliminarea componentelor unei serii de timp 
se face, de. regulă, în ordinea descrescătoare a perioadei mişcărilor 
- corespunzătoare, având în vedere că variațiile cu perioade mai mici se 
_ »grefeazá” pe cele cu perioadă mai mare (vezi fig.6.1).: Prin urmare 
è escorpio unei serii de timp pepene în principiu, următoarele 
RR pt | 
lot 8) notarea si ieliflinares trendului, operan urna căror modelu 
| - combinativ al seriei devine: i aie 
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“et Tés CER (n "ENA y/ = x CXR (m. iu taplicativ): 


Atunci când componenta sezonieră este net predominantă, iar cele 


i w arat şi reziduală sunt nesemnificative (C+R=0, sau CxR=a1), se poite. 


+ trece direct la izolarea și eliminarea lui S, nas astfel aşa-numita passie 3 


ki desezonalizată”: | 
| EA T h: aditiv) y 7 (n. multiplicativ). 


b) eliminarea trendului sl. a o ar sezoniere, rezultând seria - 


'desezonalizată şi fără tendință: 
y-TS=C+R (m. aditiv); y HIS) =C XR (m. multiplicativ). | 
Pri a eliminarea si a componentei ciclice, rezultând seria în care se 
w resimte doar influenţa factorilor aleatori: - | 
20 y TS-C=R (m. aditiv); y /(TXSXR)=R (m; -mltipticativ). 


Această schemă de succesiune a etapelor de descompunere ars un 
caracter general şi ea nu se aplică în toate cazurile. De exemplu, dacă. 
- termenii unei serii sunt nişte valori anuale, nu se poate vorbi de o 
componentă sezonieră; dacă seria spatii, rt scurtă de Aral atunci. id 


Ko | componenta ciclică poate fi neglijată ete, 


622.1. Analiza trendului 


pri Analia trendului piesupune Sie unui modi grafic s sau analitic 
cu ajutorul căruia să se poată face o ajustare cât mai bună a seriei studiate. 
Există mai multe metode de stabilire a trendului unei serii, metode care pot | 

-fi grupate în în trei A aut e metode ¿paid aora mecanice eg metode 
i Pol aja 2: 


Ti > Metode piña Sunt metode; care, aşa. cum o spune seci 
lor, se aplică pe en seriei de timp. Două sunt metodele grafice mai 


= e: one 


fi, prin natura sa, riguros ştiinţifică, întrucât aici factori subiectivi ca 


„experienţa, ochiul şi mâna sigure, intuiţia cercetătorului. sunt hotărâtori. 
— Ajustarea pe această cale are un caracter orientativ şi oferă pie ilie 


AU si air Aare tendința generală pas me particularități ale s seriel. 
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6 metoda tendinței natè (Trebici - S pioth: 1985) presupune 
trasarea „din: ochi” a liniei de tendință care pt otil cel mai bine alura. 
"generală a curbei empirice. Această metodă, numită în. literatura franceză 
courbe tracée ú main levée, i iar în cea anglo-saxonă free-hand curve nu poate 


T e: metoda” diniél; „mediane. (Grisolet 4 colab, 196 2) înlătură 
subiect vismut. metodei = „cit E a TAP Sir Mă 
anterioare, ; Ea. ; constă 
(vezi. fig.6.2)-ta unirea 
maximelor - succesive |... 
Qi, Mich respectiva |... 
minimelor succesive (np | 
Maria Ne curbei 
empirice; po. verticalele: 

ce trec prin punctele de. 
marim. şi. de- minim, 
unind cele două linii, se. |. 
plasează puncte situate Îi [og near alai ai $ 
mijlocul distanţei. dintre: Tigua A 7, pence a inel prin dl 

linia maximelor şi linia: liniei mediane (evoluţia oii de Ai, la 
ininimelor; linia care : „ba în România, EA 

uneşte . acestei: „puncte - IA aj 
medians este linia de tendini, Inconveniental eei irang este că acordă 2 
o importanță excesivá valori Or maxime şi minime (care, prin natura lor, sunt 
dependente în inai mare măsură de factorii noo, linis de rodina pochod 

căpăta, un sic au destul. de  ereeulat. A ip iza | 


y ră ¡ad 
12) SE E MN 
-Ù 3 - E 5 

S . Plain 

5 E Mai 


cum cal 


A. 
5 

Y: 
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d. medie de 


| ye Método ı mecanice, Sur nicas | care , presupun A e n 
ld în mod mecanic şi pi a po t termenii seriei, a unor formule de 
calcul, am T (Porojan, 1993); ră cd 


| ID) matădă sporului de da al seriei are SA dl sajati acestui 
indice Geri CĂ k Des cu o ag n unei i formule de forma: dai, 


Pin algara ropa å sporului media la ad ia: se obțin Aalis 
calculate (ajustate) ce corespund termnilor ai doilea, al treilea ş.a.m.d. Este 
Clar că dreapta de tendinţă (vezi fig. 6. 3) corespunde, aici, unei progresii 
aritmetice la care primul termen coincide cu primul termen al seriei studiate, 
iar pi este tocmai ră absolut n mediu. lui succesivi al i progeria; E 

vor fis. dh DEE Pd i ee 


de > 5 moară Baa 90-03 A, 


RET n » Y 
; 3 PN k i 
p’ i : -Ea Te 
tea seta GRK IA, să ey na 
- = i » 2 ¿e NO 
Ses - FERT A 
, Da 
4 d $e 3 . 
Ná 1 “ 


tar ecuaţia curbei de tendință (în acest caz, © doppi care ajuștează curba a 


empirică ' va avea forma: + 
3, = >, + be t (a es 


Această relaţie poate fi utilizată, cu anumite precaufii, pentru prognoza seriei | 
prin prelungirea (extrapol na) piesei inafara intervalului sn timp sate. a 


de serta reală. 
| Dezavantajul principal al acestei metode este acela că trendul calcat 

este determinat exclusiv 

de primul şi ultimul. 


| termen ai | seriei | y i y= 10,6 + 0,72t “aa ode Eca) 
observate, influența i Sy y = 10,6*1,03 ' (progresie EET 
„termenilor intermediari E «0 
fiind absentă. De aceea | 3. 
ajustarea „prin această | de 7] 
metodă dă rezultate | => ~“ 
y satisfăcătoare numai dacă oE "a s 
„ritmul de variație | £ s ds 
> (creştere sau descreştere) jo 0 pui ag. 2 sg iar aa Tian. E 
ad: “valorilor seriei, „este cap sina es aii y ma >| 
Ñ relativ constant. - Figura 6.3. Dare liniei de tendință prin 


|  metoda sporului. absolut mediu, respectiv a 
E IE Aneta da, ritmului medii al (nege aia 
` ritului. mediu lucrează . 7 


„eu: primul termen al seriei şi “iba mediu de creştere. ln final rezultá 0 


) ri iata brometi de rafie 1 ai căre si termeni succesivi vor fi 


A 

Pi șia căreia 1 îi i corspunde o ecuafie a curbei de tendință de forma: 

a BN a WIE i Y = y, ES (150, 1 în Aș) #1) că h 
“sa această a rațe (carta) poate fi folosită ami prognoza seriei i de tmp. 


A ii 


AER e e e metoga aodio jisai (mobile, alunecătoare) slab cio lar ` 
Y stilizată pentru identidicarea tendinței. -generale a unei serii cronologice, i 
„ Aplicarea. sa presupune calcularea mediilor glisante, adică medii ale unui set 
prestabilit de termeni succesivi, set. care este deplasat (glisat) de-a tungal 3 
| true de bază astfel încât toţi termenii seriei să fie incluşi, pe rând, în 
„calcul: , Pentru exemplificare, redăra r mai cd schema de > calcul a mediilor A 


taba tra e os cun termeni 


a 7 Y ee Y Y LA Y Y ii 3 Æ in ar: "a mă pa En Y J 
> A e hht i E te e e 


a Dacă seria are n gb iar “aital” de iar include k Gai. atunci 
numărul total de medii glisante este n-(k-1). De remarcat că este bine ca k să- 

e fie i impar, pentru ca mediile glisante să ara fi keh momentelor de timp 
<a eee ri termenilor din seria de bază; 

Înv "După « cum se observă din schema de mai i sus, prin caietul mediilor 
e dia se pierde întotdeauna informaţia. oferită de-k-1 termeni ai seriei 
a originare, egal distribuiți pe cele două extremităţi ale acesteia. Deci cu cât k 
- este mai mare, cu atât pierderea de informaţie este mai importantă. În 


i cotpenal însă, creşte gradul de „netezire” a curbei de ajustare (vezi 


-fig.6.4), fapt ce constituie un ayini atunci când se > doreşte identificarea 
< dada generale de variaţie. 
des “Metoda mediilor a | are. o dezaiantjal d de a nu a putea surprinde 
digos trendul, mai ales BARA 
- dacă zgomotul seriei este pa i 
> puternic, curba ajustată. |... 
-. conservând (chiar dacă. |. 
“într-o formă atenuată) | ra! 
- neregularitátile datorate |. 
- acestuia. În compensație, pe: 
însă, prin faptul că pee 
"tendinței reale, această | 
metodă nu maschează o |. | 
eventuală tendinţă non-. . | l | 
- liniară (cum face, de Tipua 6.4. Creşterea pase e de "netezire” a 
| exemplu , metoda "curbei odată cu lărgirea setului de valori pentru 
3 sporului mediu). fih calculul mediilor glisante. 


| În sfârşit, | 
remarcăm că metoda metilo Leul ca şi celelalte todo de ajustare 


= 3 termeni | 
- Stermeni ` 2 
9 —- 10 termeni m g S 


“Productia de porumt/ha fa) > A 
oars nassu a Co 
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+ Pâmaeiăcăit e paria cli, del DOTE: da ADE > ASAS 
„ecuaţiilor matematice pentru exprimarea tall (eu exo: cepiia ecuaţiilor” | 
ce derivă din progresiile ariimetică şi ata trică, cum s-a văzut). Prin . 
“aceasta valoarea lor predictivá este mai : zai comparativ cu urmăioarea 
grupă de metoda, care se ‘bazes ză pe una se T y alta distre pume sa elo funcții ` 


e analitice pise la dispoziti e de e analiza matematicá, 


e E Metode « ceai tsi Sunt alo otid i aci Aoi se gis ii 
i o y curbă ajustată căreia fi corespunde. o relaţie funcțională (ecuaţie) de tipul 


E y=fl). Avantajul principal a metodelor analitice este că ele iau în 
5 considerare toți termenii. seriei analizate, valorificánd astfel la maximum 
i informaţia oferită de aceştia, În acelaşi timp, odată obţinută ecuaţia curbei de 


i tendinţă, aceasta devine independentă de termenii seriei. reale, putând fi 
folosită în condiții optime peata caini: de inipit e în vederea o 


z seriei studiate, ` abea dă 


| „ Majoritatea procedeelor (inalti f isi. au y bază model 

ne regresiel. liniare simple, aceasta doarece multe dintre ecuaţiile modelelor 

-. neliniare pot fi liniarizate. prin diferite, metode, Deasemenea, calculul - 
“parametrilor curbei de ajustare optimă se bazează, în , majoritatea cazurilor, 


POA metoda celor mai mici pătrate (vezi $ 5. 3.2. 2, ). 


„e ajustarea cu ajutorul dreptei de regresie. tar simplă. Relaţia 


| analitica utilizatá este functia de gradul T (ecuaţia dreptei în plan): y=ax+b. 
as Tinánd cont cá la seriile de timp rolul variabilei Modena! i i jeacă ano 
| io specifică a relaţiei devine: ~ Zi STAL baa 

| să pa a y b (vezi fig. 6. 5 SE t ERRIN 


4 cinik pentru - obţinerea. îceticienților a şi p` e cl de la o Me 
- -observate ale celor două variabile au fost. prezentate pe larg în $ 5.3.2. 2.0 
„altă variantă de calcul, mai potrivită ztunci când se lucrează cu calculatorul 
să de buzunar şi seria nu este prea lungă, permite aflarea po - a si b 


pon Tezolvarea umg sistem s ¿Son normale': 


ii 3 0 dE 
A A și - 
Ep Se y 


1 după e cum se > guie, estimarea said es. b prin metoda celor mai mici pătrate | 
| presupune minimizarea sumei pătratelor abaterilor dintre valorile tite şi A PETER de acestora 


| pe. uitai de 7 onya AER, pată pui AR 
$o- Borat) = minim 


Valorile x rsi ys sunt cunoscute, peA de mai e find o funcio numai de a Și w : deci minimizarea 


10) 


3 Bia US pue. 


b- na. + bir e. bă E E 


y axe. + ora = Eo. 
-După ite Ta dme | E i nic ai y 
- prealabilă. a: + sumelor: | ep TO 
respective, rezolvarea. | E | 
sistemului se face prin | 
metode algebrice cum ar | 
fi, da: exemplu, cu, | | | 
| ajutorul determinanfilor Figura 6. a Ajustarea ae prodigia de 
(vezi regula îmi Cramer, . porumb la hectar fchintale) în România cu 
cap.V din apena de. W: rán picard de o văl dd 


Ai a XI-a) 


| = 2), Ad | ad ar 
Eo, Ll EnD -BoE 
E n în. | AXE AS 
Li gei nia EL. 
| d] 
mie. li ie Şi A Lo) Di Aa A 
EUD 


e ajustarea. cu ajutorul parabolei de gradul il, a cărei expresie 


analitică este funcţia de gradul II: 
y, =4 + bt + cr? 


se face anulând derivatele ente în raport cu a, respectiv în Bor cu b, operațiune în urma 
căreia se. e A Aa normale: ina 


$ur; Barioa., hi 


„sau, „da iza propias du? Voin fn: 
ra a G be, ; 


Bo ii | ag m. + DE “m a „me a Fa i pu bee 


| ie cu » joa acestei curbe esto e porii pon a a aproxima: îi | 
“misearea pdl A Ca en îti a ete | at a E 
A evoluţia . dot. “temporală :- | 
` ating un maxim (minim), |. 
„după care sensul deif 
c variaţie se . inversează, | 
pi De. exemplu . producţia `: S 
unui „câmp. petrolifer, | ¿33 
„care oreste după intrarea. | ASA AA. 
© în exploatare, prin: 1-89]. “AL ó 

bs Mi de noi sonde. | AAA NN A T 

de extracţie, până la un | E e el ON ee ES Ut TOR a Bă A y 
- maxim, după care Tait, Ajustarea productiilor de porumb i la za 
iF epuizarea zăcământului estar, cu ui papabole!. de gradul] H. în 


mb (ama) | 


edie de pora 
seses 


£ », ys a 4 aa E a A 
A ETAST A A pitt P 3 a ai e a A 
er Aa E zi A 4 in. a >: 
5 ` a Se E, wit, AT a p 
JA ARS A A A a 4 
Piia aa A E Ep 
pic ale : Ce gi Tae le A eae an E 
SA - 4 E ia. . EN E 
Zice a Maer 3 POE Me ez eta tm ie zilei 
E a Ms E; A Cp E Ri bai 
ea AE a E Na PS pe A E. a 
PI E a . si 


duce la scăderea din ce 13 
în ce mai rapida a pos d Abiria nu xo AN “me că potire e 
parabolei nu pot ajusta foarte bine variaţii monotone AS: sa 
i E descrescătoare): ale fenomenelor reale (vezi fig. 6. 6)... ERS 

E Coeficientii a şi b se determină tot Spin, metoda celor: mai mic ci... 
Pe ecuaţiile normale fiind 1 în acesta caz: NR FE | | 
] mar bi + cgt = De A — NA a PO T 

age + ber tepe x DOM ig A e 7 MI 

| ți. PAE TAN 2» IO de IA a Aa e UN 
$ Rezolvarea sistemului pentru aflarea necunoscitelor A şi c se. face tot prin E 
E metode algebrice, după calcularea ea a copiciegtilos acestora (Es, E | iai o À 
EA, If; Ey, El Yu Dydy Ñ E 
„9 ajustarea cu Sa Aa esponeniae. Relu « analitică 

po LEE este pegia exponential 

i ă YF, = ah, 
E care e poate fi liniarizată prin logaritmare: 

a = nG) = Ina) + Be i atei dă 
i “tal fold liniarizată variabilele cu care se lucrează sunt £ şi no). şi ele vor 

+" intra în calcule pentru aflarea coeficienţilor In(a) şi b ai ecuaţiei de regresie, 
prin metodele cunoscute. Curba de regresie va apare ca o linie dreaptă pe un ko 
ii + grafic la care ordonata (axa lui y) este în scară logaritmică, iar abscisa (axa. 

EN lui $. este în 1 scară aritmetică. Curba de ajustare aa provine va q. ca. 


w y A ai A o A 
NS JS i A 
TERN a 7 E dă t - E 
E De P y ES ata A 3 
T E 1 4: Je: i 
=. e Bio y 3 . 
pa A De Doe De 
spa ateu E 
= i EA 
: 


e e .. a HEALS Lia . a d 
a He ii e. EN : po 
A B ul 


ao pei antica seriei si cronologice. originare e (vei tea; pea trasarea > 

“este “ nevoie. să sa 
| satirice “In(a) ds e 
pentru. aflarea: i 
coeficientului a din |. 
ecuaţia funcţiei 
exponente Y 


e E e aiurea cu 9 
ajutoral funcției Me: pia 
i a e ab Aa E A 
care pap logaritmo is y 
loa) = pi at) y + ar aer SI. Alina variaţiei ma ei de qe 
bogo. hna eg dc ia rgembal oia) curbel ipone hii i 
Variabilele - e sio Mp pi Ap 2 CES à 
mere aflarea lui loga: 
ib prin metoda celor __. 
Sr mici “pătrate sunt | SENS 
logg) şi og(i). Carba; f- 
de ajustare va apare sub. |: 
formă de linie dreaptă pe |... 
ur grafic în scară dublu [+ 
iogatitmică;: „pentru: za 
reprezentarea ei: pe Î| 
graficul. seriei originare [i 
trebuie: antilogaritmată .. |> 
valoarea hi i log(a) vey e a 4 
fig. 6: 8) EAS “Figura. 6, 3. Ajustarea. variaţiei nia a | 
der to 9 “ajustarea cu. Vocal la hectar cu zar funiei p pue. 
ajutorul. curbei logistice > | 
(Vezi fig.6.9),. a cárei > o ne IO mi 
expresis analitică este de forma: ep siaa a 
M ea a Ka i his ca n As e Aa 


ho care ske este impo curti aiou pe a dubii de Observaţii), 10 
esto (ip > baza Sita i zecimal, iar € este baza logaritmului natural. 


e porumb (g/ha): 


ie d os 
OS a. 8. ús & n: 


: ai 


după o. curbă : logistică. 


E corespunzătoare ale seriei finnd notáte respectiv Yos: Y si Ya ni. ărul he 


Ai di și. Já uai. eeh l Ta i 
fe issbilitates tna [e | 
S demografie. şi Ecologie; ` | 
"unde. sé: stie. de multă 
“vreme < oà evolusi 
“numerică .. “udei. 
“populaţii, indiferent d 
“specie, ge: destigoară 


de legătură. cu noțiunile < 
de. „creştere. economică |... 
Zero”, „populaţie “Figura | 6.9, 
; r staționară”. $-a „curba. logit. 
„ Vogistică a. „pătruns . in Y 

„+ ultimele + decenii ` şi: în. 


A lumea terestră este o. lume finită ca spaţiu şi ca resurse; de aceea dezvoltarea 
“unei populații (in: speţă, : a populaţiei umane) şi a “activităților acesteia, chiar: 
` ` dacă păstrează o vreme in careacter exponențial, va tinde mai curând sau mai. 
ALA târziu spre o stare de stabilitate, plafonándu-se î în apropierea unei asimptote, a 
E de superioare a a cărei existenţă. se. datorează t tocmai i sus-atmintitului, RU m 


ho 
e 
` economie.: Indiferent. d: sienai de- aplicabilitate, ideea de bază e te. că 


, viii 


TA unea cu iesi curbei logistica se , poste face ieni asa- tă 


| à a pumita A meto a punctelor alese”: se aleg trei momente de timp echidistante | | 
a i (a începutul perioadei), x: (a mijlocul ei) şi x da sfârşit). valorile 


E unităţi de timp n care. intervine în. calculul coeficienţilor ecuaţiei . este cel 
E A dintre: ; momentele ; to şi Xp sau X şi ză cei trei i coeficienţi s se fara astfel: i: 


DA | 


= Doo a 70% De sa at ca 
En x pr 


eg: >) 
Nk Y) 


a mă, ad i se uta cal la li unei serii PM prin - 
| metode analitice, principala problemă o constituie alegerea tipului de curbă he 
care ajusteazá cel mai bine curba empirică. Unele sugestii în acest sens sunt 
„oferite de metodele. grafice de ajustare, ca şi de metoda mediilor glisante. j 
Hotárátoare, însă, rămâne expes rienta şi intuiţia cercetătorului, bazate pe o | 
“bună cunoaştere a domeniului în care se încadrează. fenomenul Hadit, prio 
: intermediul seriei de timp. j | 
+. În unele cazuri se constată că există două curbe, care par r să aj usteze 
la fel de bine seria studiată. În acesată situaţie se va alege curba care dă cele 
„mai mici pătrate ale abaterilor dintre valorile observate şi cele caiculate cu 
ajutorul relațiilor analitice corespunzătoare. Dacă cele două curbe fac parte 
„din grupul funcțiilor liniarizabile, un criteriu de alegere îl poate. constitui şi 
„coeficientul de corelaţie liniară simplă dintre cele două variabile transformate i 
“din ua liniarizată. 


"nepot i 


s > Variațiile sau ; fuctuagiilo: sezoniere sută aa variații care au Un 
eei periodic, ele repetându-se cu o regularitate mai mare sau mai micá 


în interiorul seriei cronologice. Se numesc „sezoniere” pentru că, într-adevăr, 


i majoritatea fenomenelor şi proceselor care prezintă o dinamică temporală sunt | 
influențate de, succesiunea sezoanelor dintr-un an. Prin extindere, însă, acest 
, determinativ este utilizat, şi. pentru mişcări a căror perioadă este mai mică | 
r decât un an (zile, săptămâni, luni, trimestre). ce 
TE - Analiza. variațiilor sezoniere prezintă un cert interes practic, dacă 
$ avem în vedere că numeroase activităţi economice prezintă un ritm şi nişte 
| particularităţi de desfăşurare care se leagă clar de succesiunea sezoanelor — 
de ex. activităţile agricole, transporturile, industria energiei electrice etc. i 
| “Separarea ri ue li sezoniere ; a unei serii cronologice urmăreşte A 
un dublu scop: AEA | 
Ca pe e O parte, lilas 4 actos Auctangilor sezoniere | 
(amplitudine, perioadă, frecvență); precum şi găsirea unor indici f 
 adimensionali care să. exprime variaţia sezonieră indiferent de ordinul de 
„mărinie ni valorilor s seriei işi de aia Lui ika (ani) inciuse! în aceasta, 


A 


facilitează i onpuniie între serii i diferite, acest lucru. a având « consecințe eide. T 


ordia ştiinţific şi practic. evidente; ae 


„i pe de altă parte, prin eliminarea componentei sezoniere, , eventual N 
şi a trendului, fenomenul. redat de seria cronologică poate fi studiat. td E 
Eenapoen de masá (aleator), cu metodele statisticii inductive. — >=. 0) capat 
Analiza variafiilor sezoniere comportá, de regula, trei. etape: punerea r 
în: bici a „oscilaţiilor de acest tip, calculul indicilor sezonieri şi 


bat seriei (lenea rc tate du crea 


| * Punerea 1 în evidenţă a variațiilor sezoniere. De regida graficui 
unei $ erii i timp evidențiază cu suficientă claritate existenţa unei componente 
sezoniere. “Dacă sunt dubii, puneri unei asemenea o imita ate oaie fi 
testată. i | 


Pentru a ilustra pedis! de lucru 4 în bai variațiilor sezoniere vom 


uz x un exemplu din a (vezi tabelul de mai AI 


Tabel nr.6. 1. Numărul lunar de căsători ii în mediul Furia, în România, a în i intervalul 195 571966 i 


(10 ani: j 
4. | a ¿Total | Media | j 
a. als] 
1958 | T 4 


15020) 14914, 


8992 a ti 


11403) 


d esist 


Graficul. acestei, serii! i (vezi fig. 6. 10) idaji cu i auficientă: Cleritate A 
existența unei componente : = OMIeTe,, explicabilă” prin. „tradiţiile nuptiale în 
mediul rural (nunfile : se fac de regula toamna, după strângerea, recoltei, sau y 
pile sărbătorile de iarnă). Verificarea i emotia vizuale ! se Eri face e i 
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Ei valorilor. aferente . lunii- i 


AE Y în a: p e a an qee qe 
„reprezentarea . “grafică a |. 
medii Tor „lun are j 20 
a multianuale, "sau prin | 5% 
- aplicares testului empiric aia 
E lui ui Šyškin (Siskin). +3 
i © media ENE S 
E inaite a fiecărei. |: 
iuni: se calculează ca po “1: | 
- medie - aritmetică a | pă FERCA EMPATA 


E. respective din toţi anii. gua 6.10, Variația aúmárului lunar de 
ù seriei (vezi ultimele două ` + căsătorii $ în mediul bei în Ana, 195 7-1 966. 


linii din tabelul de mai +=: 
sus). Prin operaţiunea d pe A La 
mediere . se. înlătură, în + {7 
bună: parte, influența | 
| factorilor.. intâmplätori; Aie; 
astfel “încât - „mediile |... 
manifestă “o “mai mare |> 
stabilitate în timp. Pentru | 
“exemplul: nostru: | 
„reprezentarea. grafică ad 
„acestor < “medii =- (vezi | E 
fig.6.11) cn fite: Y | i i 
„existenţa unei L | a | | 
componente „sezoniere ¿Figura $. 11. Variajia mar a de lunar 
"bine o conturate. Aia teza u multianual de căsătorii în mediul rural os 


E SED 


> i-a 
T Er | 


+ Nr. medie lunar de casatorii. _ | 


e E 22 
SN de 


warrt u| | 


i PE A e e jertal Sita o constă î în el o pentru isadi termen (ună) din | 
i serie, , raportul între valoarea, Junii ai si media aritmetică a a tă două ; 
fala care o o încadrează: AN 


pa PAGOS a ta EN 
E: a 
pd AROS S $ 


i (TH ATR 57 E “ . i e 
= EA e Po $ 4 


o e is hacia il a sarata se calculează o pes mulci 
A Apaor aferente h S Sep dacă această iai diferă semnificativ 
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i de E iaie il respectivă. “contribuie semnificativ w aparitia. unei. E 1 


„ componente sezoniere în seria de bază. = 77 saituri): 


6 „Pentru exemplul nostru, edito CTA iai dle sspoartelor de 
fiat sedale. în ultima. linie a tabelului 6.2. Se observă “că toate valorile l 
rapoartelor ; s sunt semnificativ diferite de 1 (poate cu excepţia lunilor iunie - 
„Şi iulie), ceea ce, înseamnă c că avem n de-a face o cu o o componentă | sezonieră bine i 


e conturată. și 


de i is Eze 


ESE nr.6, 2. Rapoartele y Ou 4 Yir 1/2) y pentru aplicarea vasului a Sri 


e Calculul indicilor. (coeficienţilor) « sezonieri. „Indicii s sezonieri i 


F | sunt nişte mărimi care exprimă contribuţia, fiecărei unităţi de timp (luni) din 


E perioada de bază (an) la apariţia unei componente sezoniere în cadrul seriei.. A 
ES De, et sunt dra sub. formă de e proporţii (absolute s sau ani: Po 


SS Y 


ma 


- Tabel me 3. . Diferenţele algebrice d die ilediă generală şi mediile lunare a. 


-multianuale ale numărului lunar de căsătorii. 


iva | eeki : 


a a E E a i + 
= z% = — 


RP ci d 


> diferenţa algebrică dintre media lunară penerală (adică media 

aritmetică a tuturor termenilor seriei) şi media multianuală a fiecărei. luni, 
“Pentru exemplul nostru mediile lunare multianuale şi media generală sunt 
trecute în ultima linie a tabelului 6.1. Diferenţele algebrice, exprimate în cifre 
absolute şi în procente din media generală, apar în tabelul 6.3. | 

Diferenţele exprimate în cifre absolute nu,pot servi la efectuare de comparații 
între serii diferite, în schimb pot fi folosite la deșezonalizarea s seriei analizate 
(vezi punctul: a ha N acestui sapat avi es Ei EEN | 


Taba pi A, poarte i (aa y valorile certă dle seriei (v.tab. 6. 1) şi 
i cele calculate cu beti gina ei Artei de tendinţă. 


E A PU ei sezonieri i obţinuţi prin pura da A, la tendinţă. 
` Această metodă implică mai întîi calcularea trendului liniar al seriei, după 
care se calculează rapoartele dintre valorile y, ale seriei si valorile $, calculate 
- Cu ‘ajutorul. ecuației de regresie. Mediile multianuale ale acestor rapoarte, 
„dt fiecare lună în parte, constituie indicii sezonieri ai lunilor respective. 
-.De remarcat că în locul mediei aritmetice poate fi copay? ca indice sezonier 
mediana şirului de rapoarte aferent lunii de calcul.. Ke 
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Lie leal nostru ecuația PERT AN liniar, aj cărei « cos osficienți a şi 
bs sunt eului după metodele cunoscute, ester = o0 io o 
or adina ul a 8 a ii N 
După e cum ` se bene coeficientul de regresie d este out ceea. T 


| 

înseamnă că există o tendinţă de scădere. în timp a „numărului lunar de | 
l căsătorii şi anume În 'ritmul de 38,484 căsătorii/lună. | | | | 
„Ecuația de mai sus o folosim pentru a lia att: WAR” de | 

e aenar pentru fiecare din cele 120 de luni ale seriei. Rezultatele calculelor | 
faina ceros o sezonieri prin această A metodă sunt trecute î în  tabe elul | 
6. 4 ace ăia ESSE, E 
Tabel ¡E de creştere cu baza în lanţ ai seriei din tab.nr.6. 1. | 


a ES . indis sezonieri i obţinuţi y prin mesada: lanturilor. dei rapoarte. Este 
metoda cea mai. Saya pentimi, estimarea. :coeficientilor. sezonieri, însă este 
destul de laborioasă. dacii 


Se. lucrează, de > fapt, cu indicii | (ritmurile) de crestere a ale seriei de 
ronologice | A. te ci iai 


82. 


fiecare! dint termenii seriei: 


ds OG calculează. mar a mind se ET cu iei ui ns PASE 


Xi 


nda astfel m-1 ÍA: Pentru. focais din lunile A A se e calea 


media multianuală sau mediana şirului de indici aferent (vezi tabelul 6.5.). 
„După aceea pentru fiacare lună, utilizând “media (sau mediana) se c calculeazá 


ritmul de creştere cu bază fixă, baza fiind în acest caz luna ianuarie. Aici se 


„utilizează relaţia. dintre indicele de creştere cu bază fixă şi cei cu baza în lanţ 


(vezi $ 6.2.), conform cáreia, la seriile de intervale, indicele de creştere cu 


“bază fixă a unui termen este egal cu produsul indicilor de creștere cu baza în . 


lanţ ai tuturor termenilor anteriori paepe al celui în-cauză). Vom avea, 
j dei girul de indici cu bază fixă: 


Igor han. îs 1,44 (în mod io, ar trebui ca harn =I); 
nario, * e = Le. Jon, XL (ete y Il „44X0, age '0, 78; 
3 al aa În den Tor febri Xima. = 1,44x0, 54X0, 76 


0, 78x0, 76 = 0,59; i 
După cum se observă, pentru a nu rescrie de fiecare dată şirul indicilor cu 
baza în lanţ ai lunilor precedente, putem prelua indicele cu bază fixă al lunii 
i precedente, pe care îl inmulfim cu indicele cu baza în lanţ al lunii curente. 

Areni ca medie sau mediană — vezi mai sus). Deci: 


= 0,59x1,15 = 0,68; 


b, Ch mahan. = CPU AN 
Y ai IC ali di i 0,68x0,84 = 0,57, 
da > = 0,57X0,91 = 0,52; 
ugt. riñon Light. = 0,52» 1,05 = 0,55; 
Sp ia > Laug  HLrepulass.. = 0,55X1,45 = 0,80, 
Ioana = Lepe X eee = 0,80X1,71 = 1,34; 
Ioan = Loerñn X umtoz == 1,34X1,03 = 1,38; 


= 1,38X0,60 = 0,83. 


| acc han. la E nov. fian. predicat 


Ask cum s-a menţionat mai sus, în mod logic ar trebui ca La na Să fie egal 
„cu 1. Daci însă, îl calculám după aceeaşi regulă ca şi ceeilalti indici, atunci 
; obtinem: N 


zile y pa" 


Tara = des ai 


| Diferenţa de la 1 la 1,12 se datorează influenţei trendului şi a de] ERA | 
"aleatoare („zgorotului”). Pentru scopurile analizei se reţine pentru îi nov 
: valoarea 1, dar. se. corectează - în mod corespunzător ceilalti 11 indici, 
, obținându-se astfel aşa - iau at: indici intermediari. în exemplul nostru, indicii 
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se micso rasă în aceeaşi proporţie ca $ si cele pontru ianuarie je (deci cu 22% 
din v pipatsa lor). si obținem şirul indicilor intermediari: Dak. 
d 1 270,67 0,52 0,60 0,50 0,46 0,48 0,70 1, 181 2 07 | 
Acesti indici sé numesc „intermediari” deoarece trebuie Verifica 
| condiția ca media lor aritme tică să fie egală cu 1; dacă nu este aşa, atunci 


fiecare din. cei 12 coeficienti intermediari s se imparte la media lor aritmeticá | 


| y se obtin astfel indicii. definitivi.. 
În exemplul nostru media celor 12 coeficienţi : pia este O, ii 
| Impártim, pi hara mois la 9, 76 si obținem cei 12 indici definitivi: | 


Dacă. vom Compara aceşti indici cu cei  “bţinuţi prin pd 

Ne pu la. tendintá (tab. 6.4.) vom constata că rezultatele celor două 

metode sunt destul de apropiate. Se observă, totuşi, că, excepţie făcând lunile: 

februarie si martie, indicii obţinuţi prin metoda rapoartelor la tendință sunt 

„ceva mai mici decât cei obținuți prin : metoda lanțurilor. de rapoarte. Acest 

„lucru se datorează: faptului că trend: seriei opinaron nu este Rinie; ci este ga 
„Uşor Spent negativ (vezi fig. 6, M aha PEE E e cae O 


ai 0 Deserovalizarea . sel” clica Odată  caleulaţi indicii A 

- sezonieri. pentru fiecare. unitate: de. timp din perioada. de bază a mişcării 
_- sezoniere - (în cazul. nostru, pentru fiecare Juná din an), eliminarea ia 
$ componentei sezoniere este relativ: simplă. În. funcţie, de tipul indicelui pă 


anta calculat, desezonalizarea se realizează astfel: 


E) „0 dacă indicele este exprimat î în valori absolute, da e diferențele i p 
a algebrice absolute dintre media generală şi mediile lunare multianuale, atunci. 
desezonalizárea se face însumând algebric fiecare termen al seriei originare E 


« cu diferența corespunzătoare. Junii din care face parte termenul respectiv... 


pi Spre exemplu, numărul de căsătorii din luna decembrie. 1958 er | 
9126; media multianuală a lunii decembrie este de 8124 căsătorii; media, 
+ generală. a seriei este de 9016 căsătorii (vezi tab. 6.1.); diferenta dintre media 

-- generală şi media multianuală a lunii decembrie: 9016- 8124 = „+ 892 o de Ă 


„tab. 6. À .). "Valoarea, desezonalizată a Tunii decembrie 1958 va. fi: 
„9126+(+892) = . 10018 căsătorii, 


Pad 


R 


1 84 


fe e “deck indicele at e oblinut e ca un ori! deci via] a pinul pă 
tu de proporție, atunci desezonalizarea: se face. prin împărţirea fiecărui 
Ea al seriei originare la. indicele sezonier. al lunii aferente. i de 
ii De exeraplu,. numărul de căsătorii din luna ianuarie 1957 a fost = 
a 13583 (vezi . tab. 6.1.); indicele sezonier al lunii ianuarie, calculat prin 

ed lanturilor de rapoarte, este. 1, 31 (vezi o indicilor sezonieri). E 
cds desezonalizatá a lunii ianuarie 1957 wa fi: Y a 
oi a a AER, gu =. ANA căsătorii. 


cae Es 


a Anal] unei. „serii iai a constituie, statistic vorbind, O 
ia destul de dificilă. Şi aceasta nu numai ca volum de muncă 
= pretins de aplicarea. taetodelor specifice de analiză, ci şi legat de intuiţia şi 
z experienţa pretinse cercetătorului, de interpretarea. rezultatelor analizei, de 
~: fiabilitatea. prognozelor care, în mod normal, finalizeazá o asemenea analiză. 
“De: aceea enumerăm; în final, câteva aspecte de ordin practic ce trebuie avute ` 
- in. vedere atunci. „când se proceden ; la, studiul unei serii cronologice - 
E (Chadule,1974):_ | | 
Cs O seria Mii trebuie: sá fie ana de, lungă. o serie cu 1 mai puţin 
de 30 de termeni nu se pers. pragi, la o analiză conciuzivă pentru 
- fenomenul studiat; pra 
i © analiza unei serii de Kae presupune parcurgerea obligatorie a a unor 
| "etape: d Jucru ce se succed într-o anumită ordine (vezi organigrama din 
- fig.6:12), aceasta. pentru a evita Piste i erori grosiere în hala al | 
E “rezultatelor; - Ri dl 
la A verificaria se e Ag este foarte importantă: Gobi avut 
în vedete faptul că testele uzuale nu sunt prea puternice, astfel încât nu strică 
| nişte apap suplimentare. la Juarca deciziei; 
a 0. extrapolarea, în viitor a. tendinţelor observate. este o too fdo. 
extrem. de delicată, care necesită informaţii suplimentare din domenii care, 
| aparent, nu au nici O legătură cu fenomenul studiat. “Trebuie ținut minte că. 
0 prognoză este cu atât mai precisă, cu cât intervalul de prognoză este mai 
scurt; în plus, modelul adoptat pentru tendinţa generală a seriei. trebuie 
verificat prin “aşa-numita „tetroprognoză”, adică extrapolarea tendinței 
| observate pentru un. interval de timp situat înaintea celui acoperit de seria 
studiată (numai că în acest caz valorile. calculate pot fi RRAS cu vei 


| A ads qlo în dic respectiv). - 
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HETNE 
MESE 
JUNE 
16293 | 
28 | 6654 | 

709 | 
47357 |. 
lam | 
1967 | 
2 | 8238 | 

| 8485 | 
{8708 |: 
{3907 | a 
19082 |: 

| 9236 | 
1 | 9370 [9 
4 [9484 | 
3 | 9582 | 
5 | 9664 |< 
ME 
Sheh 
8 | 987 | 
„19901 | 9 
[ams [9 
ee 9943 | 
| 9957 | 
67 | 9968 |: 


f: VALORILE FUNCŢII 1 DE REPARTITIE A DISTRIBUTIEI NORMALS NORMATE 


| dl lo po 
$ | 5987 | 6026. 
| 6368 |6405 | 
| 6736 | 6772 | 
4 [7088 [712 
| |7 
7734 47 
Via 
| 8289 | sar: ] 
s | 9531 das 
Î 8749. | 87 
| 8944 | 8962. |8980 | 8997 | 
[or | 9131. [09147 |s 
[926s | 92 
„| 9304 | 9406 19 
| 9618 | 968 
3 | 9744 | 97: 
3 | 9798 | 9803 | 
| 9878 |9 
19906 | 
9929 | 
| 9946 | 
| o960 | 
| 9970 | 


Anea El 


A) ¿Dia tabel se el afla probabilitatea G amuliit « cu 10. 000) u unei valla mai mici, sat 
cel dle hiela cu u (deci o probabilitate cumulată ia do Utilizarea fp rc! 
standardizarea pe a: valorii x: o: KEII 
“Exemple de utilizare: : | HE To id eS : : UTA" 
a O pentru u= -+0, 52, GEER pu = o, 6950. O E SA OIE ds 
9, pentru u: = -0,52, probabilitatea f(u) = 1 - 0, 6950 = 0, 3050. 
p. 0 pentru ffu) = 0,9750, u = 1,96, decix = 1,960 4x0 0 
ni E T pentru fu) =. 0,3527 ză, apare în del l- AA 5 0, 6473, jar e. 25 0, 38; deci 
= A A PX keat 4 AREA Je ur S eat E a Vil mde 


n. 
na sa e = Dai E. mnj na nm Mae e pe aa E mau me au. n tei temp 


SUPRAFETE s SUB CURBA NORMALĂ. le lios 


189. 


şi 4207 e 5 4305 | 4 
2 | 4345; | 4357. 
14463. | 4474. 
"| asa | 4573 
pi geti în dei 
ăn legat 
(773 | 4778 | 4783. 
| 4826 | 4830 | 4834 | 
61 | 4865 | 4808 | 4871 | 
| asos | 4898 | 4901 | 4904 
| 4920. | 4922 | 4925 | 4927 | as 
3 |4940- | 4941 | 4943 | 4945 |< 
3. | 49ss | 4956: | 4957 | <959 |, 
65 | 4966: | 4967 |4968 | 4969 | 4 
ol 4075 | 4976 | 4977 | 4977 | 4 
J; i. ] 4982 | i 4983 | 4984 i! 4984 | 4 
| 4986 ,|.4987 | 4987 | 4988 | 4088 | 
: a990 |4991 | a991 |4991 |4992 | 4 


036.14 
4310 $e 
4485 | 4 


$ 

3 

| 
4582 | 4591 1 45 
4664 | 4671 | 4 

| 


4525 | 4535 | 4545. 
presă pd pe | 
1 4699 fi | 
8 | 4762. 4767 | 
1808 | 4812 
350 | 4854 14 
4 4887 | 
| 4913 | 

| 4934 |. 
as] 

2 | asa |. 64 | 
dd int 974 | 
| oso | 4981: | 
La9s6 | 
989 | 4989 | 4990..| 
2 | 4993:<| 4993 | 


4732 | 
4783" 


> A AAA merida p a 
e 


sub: aidi “normală, : înmulţite. cu 10.000, care |. seat oa A oda ol 
„corespund distanțelor; exprimate în mumăr de |: o oi ki mi 
„deviații: standard: (70), dintre medie şi o. valoare | E ea Sea e 

“dată x (este! ‘necesară; „deci, ; standardizarea: | TEn D 
prealabilă a acesteia. diñ urmă). i pi = i ES 

A Exemple. de Utilizarea LS 
e pentru z= 1,45, o cuprinsă între i medie mp A PR 


de cae 0,4205 = 42,05%4g/Gind sim în E A 


de dreapta (deci. este. mai. mare) îaţă de medie. i oi 
i © pentru z:=.—1,45, suprafaţa este aceeaşi, E A E 

E Meli situat í în ati, NS este, mai de A ca "o AR. ca ma 

Joe e. fetițe un: a intel care. se ras de o pane si de ata « a „medic pos la o y disan 20, 
$h papaja corespunzătoare este dubiul valorii citit e pa tabel. É ANS Te 


1: | azo: | 00] 


Amtabél apar suprafețele (probabilitáye) > | s i > i et _ = n ARE ETERN A 1 


Pa CEE A O 
SR Soo Nam tine, 


na 
to 


ch Da-i ap 
Li EY d 
x : Y 
CA 100 
E 
Y 
A “E. 
N: 
= ina N 
A 
REE . 
Soep 
A [i 
Cg 
. 


Rh E tus bay 
SAG 


EN ES 


es iS 004 


lu 7 


= 
Oo Q&Q 


(oe) 


si „a a Vaen LE CRITICE ALE DISTRIBUȚIEI ms 
"PENT RU DIFERITE NIVELE DE SEMNIFICAȚIE 


ii „ Anexa mn. 


-Nivelul de: email penru n vestul unilaseral E 


E) re 089, Si 
481| 7,453 | 
4 |. 5,593 | 
032| 4,773 | 


A 4317. 


: as | 


d 3,690. 


$ 3,581 | 
a hue B 
5 | 3,428.. 

3,372 | 


"| 3,286 


: 3,965 


898| 3,222 
78| 3,197 
8651 | 3,174 


să |'3,135 | 


3,153 


| 3119 
7 | 3,104 
| 2:27 | 3,090. 


“| 3,078 

779 | 3,067 | 
1] 3,056 | 
3,047 


31,598 | 


12,941 


"9,610 ; 


6,859 - 
5,959 E 
5,405. q 


5,041 4 
ARI 


4,587 
4,437. 


4318. 


422% | 
4,140 


4073] 


4,015. 


3,922 


13,88 | 


3,850 | 


g 3,819 
` 3,192 


3,167 


3,745 - 
gm 
3,707 
3,690 


3,674 } 


Pe i CR E y: Noul de if icajie 7 paniru e testi d urile ral | 
| 410,45 Taz] ` 0,05 d 205 Llena “|. 0,005 | 6 


1,65 r pl 2,3: 
,645 "| 1 e, 2 3: 


m Ta + 0 ONE 
Jos Tora eo 
9 | 085 | r- 
60 | pot d | 
| 120| 0.845. fe 
[os do 


i ed CRITICE ALE DISTRIBUȚIEI P > (saca SNEDECOR) | 
Să „Pentru a nivelul « de semnificaţie ce a = 0, O. 


192. 


i EREL > șia a> umărul gral de libertate pentru cea. mai mică dintre cola două variante 

estimate; de 
de i n= numrit gradelor de libertate pentru cee mai mare > dintre seld două variante 

estimate. 
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ZT ZI 


(161, TH z] 


1119, 00 | 
13| 9,55 | 
srl sp! 
SERTI 
59| 4,74 | 
32 | 4,46 | 
| 4,26 
| 4,10 
3 13.98] 
| 3,88 | 
| 3,80-| 
| 3,14 | 
3,58 | 
| 3,63 | 
5 13,59: | 
1 | 3,58 
3s | 3,52 | 
4,35 | 3,49 | 
32 | 347 | 
13,44 
213,42 | 
26 | 3,40 | 
43,38 | 
1 3,37 
3,35 | 
3,34 | 
„18 | 3,33 


| |435 | 
4,07 | 


t EREET o A a ys rame ce Mape ala IE d 
VALOR AUS SADA i 


A > J 


sas]: 
928| 9, 
6,59 | 6, 
5,41 | 5, 
4,76 | | 


3.86 | 
ial 
3,59 | 
3,49 | 
3,41 13, 
3,34 | 3, 
3,29 
3,24 | 
3,20 |, 
13,16 | 2,9 
3,13 |2, 
3,10 | 
|-3,07 | 
3,05 | 
3,03 |2, 
3,01 | 
2,99 | 
298| 
2,96 | 2,7: 
2,95 12,7 
4,18 283 | 2 
| 447 | 3,32 A 2,69 | 


mz 
Apa 19, 
190| 
| 6,26 | 6, 
PT ' 
| 4,39 | 4, 
| 3,97 
1 3,69 | 3, 
63 | 3,43 | 3, 
21333 13, 
| 3,20 | i 
Faart 
| 3,02 | 2, 
12,96 |2, 
| 2,90 | 2, 
142,854 2, 
las 
312,74] 
| 2,74 | 
zi] 
| 2,68 [2 
2,66 | 2,55 
o | 2,64 | 2, 
A .1'2,62:| 2, 
12,60 |2, 
{i 12,59 | , 
| 2,57 12, 
12,56 | 24 
| 2,54 12,4 
2,53 | 2,42 


017233.9 | 
| 19,36 | 
| 8,88 
| 6,09 
| 4,88 | 
{4,21 
| 3,79 | 
| aso | 
| 3,29 | 
aia! 
3,01 | 
| 282| 
284| 
42,77 |2; 
Lazo dl 
2,66 [2 
665 | 2,58 | 
63 | 2,55 | 
| 2,49 |2 
1247 | 
"| 2,45 |2 
12,43 |2 
2,4104: 
| 2,392 
2,374 
43 | 2,35 
12,34 | 


1239, Si 233, 91 
| 19, 37 | 19, a 
; 8, 84 | 
|:6,04 | 


4,82 


| 2,28 
2,27 | | 


8,74 | 8 
5,91 s, 
| 4,63 
44,15 | 


pe 
oa Lap 
Ur. 3 


400 | 3, 


| 3,28 | 3, 
3,07 12, 
2,9112, 
lazo | 
| 2,69 | 2, 
2,60 | 25 
o | 2,53 | 23 
| 2448] 2, 
1242 | 24 


2,38 1 2, 


1 42,34 | 2, 
812,31 |2, 
42,28 | 
| 2,25 | 
122] „0 

3 | 220 |2, 

| 248| asa 
J 216 | 1,96] 
| 2,15 | 1,9 

„30 | 2,13 | 
229| 


2,12 | 1 19 


A 2,10) y Ai 
2,09 | 1,89 | 1, 


y, — numărul gradelor de libertate. pentru cea mai mică dintre cele două variante k 


Mide — numărul gradelor de libertate pentru cea mai mare dintre cele două variante 


VALORILE a ape ALE DISTRIBUȚIEI a 


| Nivell de small a 7 ; 
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y — mumătul gradelor de Mira PEM, O 
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y a, ES 


0, 30. 


alei 40 iin 
a N y 20 o L 
o | i 80. qe 
| 2350 | 
„| „24,90 | 
30 | 26,00 h 
o | 270| 
30. | 2820 | 
| 29,20. 
| 30,30 
0. | 3140. |- 
30 | 3250 |" 
30 | 44,20. | 

| sa | 
o | 6520 |. 
30 i, 10 | 
30 | sto | 
5 96,50 | 
| 106,907 | 


ner 


0,10. 


24,80. 
26,00 
27,20 
28,40. 
29,60. 


30,80 


32,00. 
33, 20 
34,40 


| isi 35,60 


PP 


Nivelul da semnificaţie a 


ii 
ii 
Ti 
El 


i sg q 
so | 
4320 | 
14, 40 > d pe 
E SA 
96,60. | 
| 107,60] 
_118,50_| 


Dica ana aan 


9,05 A 


ARC cai Asia A DEEE 


23,50 


26,30. 1-28 


2760 |: 
2899 |. 
-30,10 . Es 
310]. 
320 pi 
3350. |. 
35,20 sal 1-4 
3640 |. 
37410 | 
3890 i. 
40,10 iei 
| 41, 30. po pS 
en] e 
5585 | 
6500 | 7 
PAT UR. 


9050 
R 101, Dj. 
i 124 20. Pinos 119: 


E É 3 
E STA HIM: AP 
e a E a | 


DAR mamara a 


ooa | 0,001 | 
y 39, 3 
3 x y ¿1.90 3. 
Jal a 

2 A as 
76454 
9 4 i 
| 488] 
6 |. 49,7 | 
Y. q | si d E 
a | as 
TE 
a pasri] 
a 569] 
6 pe e RE 
150,9 | 597 | 
| e i Ba] 
5,2. e EN 86, T. sil 
a 
23 | 124,8 | 
124,1: |. 137,2. | 
5,80 149,4 | 


ui AT TABELUL DIFERENȚELOR | MAXIME gi PENTRU TESTUL 
| ¡LSO se il | 


i ig nes pa | Nivelul de comilicaţe 0 a i 


e a mara ec pr e | 
14. | 0314 0,349 “0418 | 
: 0,304 0,338 WE 0,404 O 
0,295 0328 0392 | 
| 0,286 ` 0,318 0,381- | 
| ozs 10309 03m] 
| 00272 + 07301 10,363 | 
| 0,264 0,294 0,356 | 
TE ol 3 0,32 
A a 0029 | 
e Porra “0923 . 027 | 
EX 1,36m 1,63//a | 


ER 


EE Ma 


e 
e 
- A 


îi on — ata si Sti ale (e cul E de Ei sau d esantioanelor (cazul 
„tuia de comparare a două pets empirice, eşantioanele având acelaşi volum 1, =n,=n). 


ini Li la testele de comparar, pentru volume n ale eşantioanelor mai mari de 35, se poate 
` lucra gi cu eşantioane c de volume inegale; în acest caz se ia în considerare volumul total al celor 


ES două egantioane, diferenţa. maximă teoretică fiind calculată cu f arin relațiilor de mai jos 
í t testul. bilateral: y be 


onsas 0,05 => ba = 1,36 |- 


ens a =001 => da = 1,63 | —— 


0 ns. a = 0,001 > dm = 1,95 
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m PIN ha ar en 


VALOREN IMITĂ ALE Lut r 
pentru d ak nivele de > semnificatie 


Nivelul de semnificaţie a a. ij : á eL NE 


AA 0,05 t- TA or: 


7 0! 9969, E 0, 9995- y q e oa 4000 $ A 0 SI 3 
2 | 0,9009 0, 9500. < 0, 9800 |517. p0 No 4555. 0,5 
1 0,8054. ..0,8783.. 0,9343 | + 18 | 0,4438: 
A 1000093 "0, g1í4 0,8822 |. 19. | 
1 0,6694. 0,7545 :.:0,8329 | ..20.. | 
6 | 0,6215. 0,7067 .0,7887 |... 25 | o 
0,5822 ° 10,6664 > 0,7498. |: 30." | 0,22% 
| 0,5494 = 0,6319 0,7155 |: 35. 1.027 
2 | 0,5214... 0, 6021 . 0,6851. | 40; ] he 
- JO. | 0,4973 : 0,5760: 0,6581 FEBR 
¿dl 0,4762 0,5529 0,6339 |": SA 0 
0,4575: 0,5324 | 0,6120. i: 60: [.-Q 
13.1 0,4409. 0, „5139... 0,5923 GQ 
141 0,4245: 0,4973. 0,5742 | 80 
0,4 Aa $, 4821 li 0 ST y A 


“ mabetul cuprinde a fs minime, statistic semnificative, AS i coefisientului de corelaţie 
— liniară simplă 7 dacă r calculat este mai mare decât r din: tabel, atunci se poate. afirma (cu. un 
„rise de eroare ds cu a) că între cele două, variabile există: o corelaţie liniară semnificativă, 


- În tabel se intră cu numărul cr du îs s libertate, y çare La acest, caz va afi: ie n = n ai 


T 26- - ia de E pete de pie: 
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Anexa , VI a. 


| 
| 


| Hi En viui À 
VALORILELDATA ALE COEFICIENTULUI Pp AL LUI 1 SPEARMAN - | 


¿ataca A idea de pa 


oh tabel se. intră direct cu numărul de e perechi d de e valori, iar nea s satistica 2 ¡E 
ooficientla An calculat se ră zar la fel, ca e Anexa dde y 


E 
GEJ _OGIE-CEO 


| 


K eu 
E 


ta “Tao ca cu ) NUMERE ALEATOARE pa 


oS: A KERN AFI 


07.53 80 00:33. 
1.3503 4663 : 
30 7434 1463 

| 21 34_ 6252-4773 09 2828 1815 32 


„e Tabelul de mai sus (limitat, din considerente de spaţiu, la doar 50 de linii) poate fi. 
+ utilizat pentru prelevarea de eşantioane aleatoare dintr-o populaţie ale cărei elemente sunt într-un 
număr finit, Reamintim că volumul unui eşantion, alături 'de caracterul său aleator, asigură : 
:reprezentativitatea egantionului — însușire care permite extinderea concluziilor rezultate din: 
A analiza eşantionului asupra întregii populaţii din care acesta provino... - Pi ai N 
Cerite t Uitilizarea tabelului ` cu numere aleatoare presupune numerotarea prealabilă. a 
~ elementelor populaţiei, urmată de extragerea acelor elemente ale căror numere de ordine coincid 


cu numerele citite. în coloanele din tabel (de sus în jos şi de la stinga spre dreapta). Spre | 
“exemplu, dacă setul de date initial cuprinde 100 de valori (eventual ordonate după mărime sau 


după un alt criteriu), un eşantion de 10 itemuri va fi alcătuit din elementele care, în setul inițial, - 
“au numărul de ordine 87,25, 5, 8l, 0... 78, 41 (deci se citesc primele două cifre din prima 
-. coloană, secventa 00 reprezentând numărul 100); dacă populaţia este formată din, să zicem, 


:- 10.000 de elemente, atunci din tabel se citesc primele patru cifre din coloană, secvența 
.* reprezentánd numărul 10.000, iar un eşantion de 100 valori va fi alcătuit din elementele care, .. 
“Am setul initial, au ‘numerele de ordine 8735, 2552, 8717 etc. În aceste două exemple citirea ` 
> numerelor aleatoare a început din prima linie a primei coloane. Trebuie remarcat, însă, că citirea 
..... poate începe de oriunde în interiorul tabelini. AEN a DEN IA AI O 
ERIE i PO exemplele de mai sus numărul de elemente ale celor două populaţii (100, respectiv 
10.000) au fost alese în aşa fel, încât din tabel.au putut fi citite toate numerele succesive din 2 
“cifre (de la 00 la 99), respectiv din 4 cifre (de la 0000 la:9999). Ce se întâmplă, însă, dacă 


`; populaţia este alcătuită din — să zicem — 3000 de elemente, iar eşantionul trebuie să aibă 100 


` de valori? Solutia cea mai la îndemână este de a extrage din tabel numai numerele din 4 cifre: 
care sunt mai mici de 3000, ignorându-le pe celelalte, până se obțin 100 de numere între | gi. 


"3000. În felul acesta, însă, lucrul cu tabelul devine mai greoi, ca sá nu mai vorbim de situaţie 


“An care se ajunge la sfârşitul tabelului înainte de a se fi putut preleva cele 100 de valori. O 
“ modalitate de înlăturare a acestui neajuns O constituie re-numerotarea elementelor populaţiei cu 


-numere care acoperă acelaşi ecart de variaţie (1 la 3000), dar mai mari ca limita respectivă: de 


la 3001 la 6000, apoi de la 6001 la 9000 ş.a.m.d. În felul acesta pot fi utilizate toate numerele | 


ae din tabel, economisindu-se timp şi putându-se lucra şi cu un tabel de mici dimensiuni (ca cel din 
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y i po ormat: 61 x86/4 6 
Gli tipo: 12,75. 


“iii Comanda: 89 5 a a 


"perl ci ouale a 


Dating de multiplic are. a Să 


| “atu Uniyoreiăii «AL . Cuza» 


Apărut: 1995 


